Estudio empírico del enfoque asociativo en el contexto de los problemas de clasificación
Resumen
. Investigaciones realizadas por la comunidad
cient´ıfica han evidenciado que el rendimiento de los
clasificadores, no solamente depende de la regla de
aprendizaje, sino tambien de las complejidades inher- ´
entes en los conjuntos de datos. Algunos clasificadores
se han utilizado habitualmente en el contexto de los
problemas de clasificacion (tres Redes neuronales, ´
C4.5, SVM, entre otros). No obstante, el enfoque
asociativo se ha explorado mas en en el ´ ambito ´
de recuperacion, que en la tarea de clasificaci ´ on, y ´
su rendimiento se ha analizado escasamente cuando
se presentan varias complejidades en los datos.
La presente investigacion analiza el rendimiento del ´
enfoque asociativo (CHA, CHAT y Alfa Beta original)
cuando se presentan tres problemas de clasificacion´
(desequilibrio de las clases, solapamiento y patrones
at´ıpicos). Los resultados evidencian que el CHAT
reconoce mejor la clase minoritaria en comparacion con el resto de los clasificadores en el contexto del
desequilibrio de las clases. Sin embargo, el modelo
CHA ignora la clase minoritaria en la mayor´ıa de los
casos. Ademas, el modelo ´ CHAT exhibe la necesidad
de requerir de fronteras de decision bien definidas ´
cuando se aplica el metodo de ´ Wilson, ya que su
rendimiento se incrementa. Tambien, se not ´ o que ´
cuando se enfatiza un equilibrio entre las tasas, el
rendimiento de tres clasificadores incrementa (CHAT,
RB y RFBR). El modelo Alfa beta original sigue
mostrando un desempeno pobre cuando se realiza el ˜
pre-procesamiento en los datos. El rendimiento de los
clasificadores incrementa significativamente al aplicarse
el metodo ´ SMOTE, situacion que no se presenta sin un ´
pre-procesamiento o submuestreo, en el contexto del
desequilibrio de las clases.