Published December 3, 2020 | Version v2
Thesis Open

Aplicación de técnicas de aprendizaje de maquinas al problema de la clasificación de cerámica arqueológica. Un estudio de caso

Description

Este trabajo explora la utilidad de la aplicación de un enfoque de adquisición de conocimientos

al problema de la clasificación de objetos arqueológicos, particularmente fragmentos cerámicos;

uno de los materiales más abundantes en el registro arqueológico y cuya gestión implica mayor

costo en términos de tiempo y recursos en el marco de cualquier investigación. Para ello se

construyó un modelo tipológico implementando diversas herramientas de los principales

paradigmas del aprendizaje de máquinas (aprendizaje no-supervisado y supervisado). El modelo

fue implementado sobre un conjunto de datos de cerámicas arqueológicas del caribe colombiano.

Los resultados revelan que el modelo funciona mejor cuando se cuenta con tipologías de

referencia bien definidas y criterios clasificatorios estandarizados que puedan servir para entrenar

algoritmos en tareas de aprendizaje supervisado. Por el contrario, una de sus mayores debilidades

es su poca utilidad comparativa. Esto no solo se debe a las herramientas utilizadas sino a la calidad

de la información disponible en el contexto de estudio

Abstract

This work explores a knowledge acquisition and data analysis approach to the problem of

archaeological classification. Particularly classification of pottery sherds; one of the most

abundant and challenging elements of the archaeological record. To this end, a machine learning-

based typology was developed applying different classification schemas; starting with an

unstructured dataset (non-supervised paradigm) until the training of different supervised

classifiers to automate the process of classifying new instances. This process was applied to a

dataset from the Caribbean coast of Colombia to evaluate the accuracy and performance of

different algorithms.

The results reveal that, the model Works better with supervised classification tasks with

consistent typologies that can work as training models. Also, the model shows a decent

performance working with a categorical multivariate dataset. Conversely one of his major

weaknesses is his lack of comparative utility. That's not only because the tools and procedures

that was implemented but for the quality of the data used.

Files

AbstractTFM.pdf

Files (1.6 MB)

Name Size Download all
md5:b94337835c5a12145da49d8f646cbb37
1.6 MB Preview Download