scispace - formally typeset
Search or ask a question
Journal ArticleDOI

Comparación cuantitativa de matrices de datos

31 Dec 2016-Research on computing science (Instituto Politecnico Nacional/Centro de Investigacion en Computacion)-Vol. 120, Iss: 1, pp 31-40
TL;DR: A modern technique for elastic matching comparison is performed, which considers all data in the matrices, globally, and not just analizing extracted features like other available techniques do.
Abstract: There are few elastic matching techniques that take matrices as input. Perform an analysis comparing the similarity of features while the existing ones techniques are purely statistical. A modern technique for elastic matching comparison is performed in this paper. This technique considers all data in the matrices, globally, and not just analizing extracted features like other available techniques do. Experimental results are presented using a synthetic dataset of matematical functions; however this method works for any object or phenomenon that can be represented as matrix.

Content maybe subject to copyright    Report

Comparaci´on cuantitativa de matrices de datos
Angel Mandujano-Garc´ıa, Jes´us Figueroa-Nazuno, Hiram Calvo
Instituto Polit´ecnico Nacional,
Centro de Investigaci´on en Computaci´on, Ciudad de M´exico,
M´exico
b140477@sagitario.cic.ipn.mx,{jfn,hcalvo}@cic.ipn.mx
Resumen. Son pocas las ecnicas de alineamiento el´astico entre ma-
trices de datos. Las que existen realizan un an´alisis comparando la si-
militud de caracter´ısticas, o algunas son puramente estad´ısticas. En este
trabajo se presenta una t´ecnica moderna para la comparaci´on el´astica de
matrices num´ericas que considera todos los datos disponibles de manera
global y no por an´alisis de extracci´on de caracter´ısticas como hacen otras
t´ecnicas. Se presentan resultados de la experimentaci´on utilizando como
ejemplo datos de funciones matem´aticas; sin embargo, este m´etodo puede
funcionar para cualquier objeto o fen´omeno que pueda ser representado
en forma matricial.
Palabras clave: Medida de distancia, alineamiento el´astico, matrices
num´ericas, Fechet moderno, funciones matem´aticas.
Quantitative Comparison on Data Matrices
Abstract. There are few elastic matching techniques that take matrices
as input. Perform an analysis comparing the similarity of features while
the existing ones techniques are purely statistical. A modern technique
for elastic matching comparison is performed in this paper. This tech-
nique considers all data in the matrices, globally, and not just analizing
extracted features like other available techniques do. Experimental re-
sults are presented using a synthetic dataset of matematical functions;
however this method works for any object or phenomenon that can be
represented as matrix.
Keywords: Distance measurement, elastic matching, matrix represen-
tation, modern Fr´echet, matematical functions.
31
ISSN 1870-4069
Research in Computing Science 120 (2016)pp. 31–40; rec. 2016-09-27; acc. 2016-10-28

1. Introducci´on
La comparaci´on es un aspecto muy importante dentro de la vida diaria y de
la computaci´on, siempre estamos tomando decisiones que se basan en alg´un tipo
de comparaci´on. Cuando comparamos, lo primero que realizamos es obtener de
alguna manera, las caracter´ısticas o rasgos descriptivos de los objetos implicados
en la comparaci´on, y as´ı, se pueden observar las diferencias y/o similitudes entre
´estos. Esta estrategia en los seres humanos es realizada con naturalidad; sin
embargo, dentro de la computaci´on llevarla a cabo no es una tarea sencilla.
Las computadoras necesitan de alguna herramienta matem´atica que se ocupe
de realizar una medici´on cuantitativa y realizar una comparaci´on. Con base en
eso, es com´un realizar una etrica de los rasgos caracter´ısticos de los objetos.
Una alternativa, que se presenta en este art´ıculo, es que una computadora pueda
realizar una comparaci´on no considerando rasgos descriptivos, sino tomando en
cuenta todos los datos que se tienen disponibles, es decir, de manera global. La
alternativa se basa en el uso de una t´ecnica que realice un alineamiento el´astico
(Elastic Matching) sobre objetos en dos dimensiones.
Elastic Matching (EM) se ha utilizado en diversos problemas, como el recono-
cimiento de rostros, el reconocimiento de huellas dactilares, an´alisis de im´agenes
m´edicas, visi´on por computadora, entre otros. EM es una ecnica que en general
ha dado buenos resultados. Formalmente hablando, EM es definido como un
problema de optimizaci´on con respecto a un mapeo elemento-elemento, lineal o
no lineal [6]. En otras palabras, EM mide el esfuerzo que se tiene al ajustar A
sobre B, siendo A y B dos matrices. EM optimiza el problema de alineamiento en
varias dimensiones, 1D, 2D, 3D, etc. Para este trabajo se realiza un alineamiento
en dos dimensiones, tambi´en llamado Two-Dimentional Warping (2DW). Este
alineamiento ocurre en arreglos bidimensionales tambi´en llamados matrices, por
lo tanto el objeto A y B son dos matrices que contienen datos num´ericos. EM
es un problema que presenta una complejidad computacional NP-Completo [7]
debido a los grados de libertad que poseen las matrices. Las ventajas de EM
sobre las t´ecnicas de selecci´on de rasgos son: EM es adaptativa, as´ı generalmente
posee mayor capacidad para obtener diversas deformidades que las t´ecnicas
cl´asicas no pueden, la optimizaci´on 2DW por s´ı misma, describe la deformaci´on
de car´acter dominante. Este hecho muestra que EM posee propiedades ´utiles
de ecnicas de an´alisis estructural. EM puede estar relacionado con los marcos
estad´ısticos y estoasticos. Active Shape Models y 2D HMMs son dos buenas
t´ecnicas de ejemplos [10]. Las caracter´ısticas de EM principalmente dependen
de dos factores: (i) la formulaci´on de 2DW, afecta el rango de deformaciones
compensables. Esto quiere decir que la formulaci´on de 2DW est´a relacionada
con el problema que se quiere resolver; (ii) la estrategia de optimizaci´on de
2DW, afecta la precisi´on de los resultados de EM. De manera general, en [10] se
menciona que las estrategias para obtener una soluci´on ´optima global proveen
resultados as precisos que aquellas soluciones que son sub-´optimas. La t´ecnica
propuesta se basa en Programaci´on Din´amica, donde se proporciona una soluci´on
´optima global.
32
Angel Mandujano-García, Jesús Figueroa-Nazuno, Hiram Calvo
Research in Computing Science 120 (2016) ISSN 1870-4069

Fechet Moderno (FM) es el nombre de la t´ecnica de comparaci´on matricial
que se ha desarrollado en el presente trabajo. FM es una medida el´astica entre
matrices de datos. Se le ha puesto ese nombre debido a que se basa en la
Distancia de Fechet. La distancia evaluada bajo esta aproximaci´on es invariante
a las deformaciones y surge debido a la falta de ecnicas que analizan los datos
representados en dos matrices de manera directa.
Existen t´ecnicas que realizan la comparaci´on de matrices, como la presentada
en [6], que emplea una reducci´on de dimensionalidad en las matrices, usando
Eigenvalores [9], esto es, se obtienen los datos caracter´ısticos de cada matriz y
eventualmente se realiza una comparaci´on de rasgos caracter´ısticos. Sin embargo
son pocas y es muy dif´ıcil encontrar ecnicas de comparaci´on global. El presente
trabajo se desarrolla la ecnica Fechet Moderno (FM), es una ecnica muy
´util cuando se requiere comparar datos de manera global, es decir, cuando
se necesita considerar todos los datos que se tienen en las matrices y no los
datos caracter´ısticos. Se puede aplicar en diferentes ramas de la ciencia como:
la miner´ıa de datos, la bioinform´atica, tratamiento de im´agenes, reconocimiento
de patrones, entre otros.
2. Antecedentes
En esta secci´on se explican conceptos importantes para la descripci´on de la
distancia Fechet Moderno, se explican brevemente conceptos necesarios para la
explicaci´on y realizaci´on de la ecnica:
Similitud entre matrices: El an´alisis convencional para la medici´on de similitud
es mediante la selecci´on de aquellas propiedades que se consideran importantes o
relevantes; sin embargo, hacer una selecci´on apropiada es una tarea muy dif´ıcil,
aunada a esto, siempre hay erdida de informaci´on en los datos originales, porque
existe alg´un proceso de descarte [4]. El reto de investigaci´on es desarrollar
procedimientos sin hacer dicha selecci´on, sino utilizar t´ecnicas que permitan
emplear toda la informaci´on disponible sobre las entidades involucradas. Para
este caso se trata de matrices de datos num´ericos.
Distancia de Fr´echet: Maurice Fr´echet fue un matem´atico franc´es que hizo
trabajos de topolog´ıa muy importantes. En su tesis doctoral [5, 8], presenta un
procedimiento general para medir la similitud entre dos curvas F y G donde se
tiene en cuenta el orden de los puntos a lo largo de las dos curvas o secuencias. De
manera informal, Fechet preseno una analog´ıa sencilla: la Distancia de Fr´echet
es la longitud m´ınima de la correa necesaria para conectar a una persona con su
perro que salen de paseo, ambos caminan sobre trayectorias diferentes, pero que
tienen la misma direcci´on, sin poder regresar [1].
Dynamic Time Warping (DTW): Es una transformaci´on que permite la expan-
si´on y comparaci´on de una secuencia. Generalmente donde as se utiliza es en
series de tiempo para la alineaci´on local y global con respecto a otra secuencia,
33
Comparación cuantitativa de matrices de datos
Research in Computing Science 120 (2016)ISSN 1870-4069

con el objeto de minimizar la distancia base, que com´unmente es la distancia
euclidiana. DTW es propia para computar la semejanza entre secuencias que se
encuentran desfasadas una con respecto a la otra, o cuando una ellas presenta o
ausenta segmentos con respecto a la otra [2]. Dadas dos secuencias F y G, DTW
forma una matriz de dos dimensiones. Intuitivamente cada celda de la matriz
representa un mapeo de un valor en la secuencia F con un valor de la secuencia
G. El mapeo es la suma de la distancia individual de los mapeos previos antes
calculados (ver Fig. 1a). La salida de DTW es la distancia m´ınima entre las
secuencias y se encuentra en la ´ultima posici´on de la matriz generada. DTW
est´a basada en la idea fundamental de la Distancia de Fechet.
(a) Funcionamiento de Dynamic
Time Warping.
(b) Recorrido completo de la distancia de Fechet
Moderno.
Fig. 1. Distancias en secuencias y distancias en matrices.
3. Descripci´on de la ecnica Fechet moderno
Fechet Moderno (FM) extiende el etodo de DTW a dos dimensiones,
es decir, los datos ahora no son secuencias o arreglos unidimensionales, sino
matrices num´ericas. FM se basa en DTW de tal manera que se pueden analizar
datos en R
2
. La entrada para FM son matrices de datos A y B de tama˜no (P, Q) y
(R, S) respectivamente. Fechet Moderno es un etodo de comparaci´on el´astica
que se obtiene comparando la distorsi´on que se encuentra en filas y columnas de
la matriz A contra todos las filas y columnas de la matriz B, de esta manera se
hace un recorrido completo en las dos matrices de entrada, como se muestra en
la Fig. 1b.
Se forma una matriz de distancias acumuladas de cuatro dimensiones llamada
M, cada celda de M se refiere a una alineaci´on entre algunas celdas de A y B.
34
Angel Mandujano-García, Jesús Figueroa-Nazuno, Hiram Calvo
Research in Computing Science 120 (2016) ISSN 1870-4069

Esto es an´alogo a lo que ocurri´o con DTW (ahora no son valores de secuencias,
sino secuencias completas). M(p, q, r, s) se refiere a una alineaci´on entre A(p, q)
y B(r, s).
De manera similar que en DTW, ahora se debe ir llenando la matriz M
que guarda la distancia acumulada; una celda de M est´a dada por la m´ınima
distancia de los mapeos previos de la posici´on actual. De este modo, la distancia
entre las matrices de datos se encuentra en la ´ultima posici´on de M . Dados 4
indices (i,j,k,l), en la matriz M se calcula lo siguiente:
M(i,j,k,l) = min{ETAPAS_PREVIAS(i,j,k,l) + Costo(i,j,k,l)}
costo = DTW(R1, R2) + DTW(C1, C2).
Para una sola matriz, cada coordenada (i, j) tiene tres posibles etapas previas,
sujetas a las limitaciones de frontera: (i 1, j 1), (i, j 1) y (i 1, j). En la Fig.
2 se muestran las etapas previas de las matrices separadas, es decir, los incisos
a), b), c) son las etapas previas de la coordenada (i, j) en la matriz A que ser´ıa el
inciso d), mientras que los incisos e), f ), g) son las correspondientes en la matriz
B de una coordenada especifica h).
Las etapas previas totales que se ocupan en Fechet Moderno son el resultado
de combinar las etapas previas de la matriz A con las de la matriz B, exceptuando
las coordenadas d) y h), que indican la etapa actual que se est´a calculando. En
otras palabras, las etapas previas son los puntos adyacentes con coordenada
individual as peque˜na en la matriz M. En la Tabla 1, se tienen las etapas
previas totales con su respectiva funci´on costo.
Fig. 2. Etapas previas para la matriz A, son a), b) y c). d) es la etapa actual.
Similarmente son las etapas previas de la matriz B.
35
Comparación cuantitativa de matrices de datos
Research in Computing Science 120 (2016)ISSN 1870-4069

References
More filters
Journal ArticleDOI

181 citations


"Comparación cuantitativa de matrice..." refers background in this paper

  • ...En su tesis doctoral [5, 8], presenta un procedimiento general para medir la similitud entre dos curvas F y G donde se tiene en cuenta el orden de los puntos a lo largo de las dos curvas o secuencias....

    [...]

Journal ArticleDOI
TL;DR: The discrete Frechet distance as mentioned in this paper is the minimum length of a leash required to connect a dog and its owner without backtracking along their respective curves from one endpoint to the other.
Abstract: The Frechet distance measures similarity between two curves $f$ and $g$ that takes into account the ordering of the points along the two curves: Informally, it is the minimum length of a leash required to connect a dog, walking along $f$, and its owner, walking along $g$, as they walk without backtracking along their respective curves from one endpoint to the other. The discrete Frechet distance replaces the dog and its owner by a pair of frogs that can only reside on $m$ and $n$ specific stones, respectively. The stones are in fact sequences of points, typically sampled from the respective curves $f$ and $g$. These frogs hop from one stone to the next without backtracking, and the discrete Frechet distance is the minimum length of a “leash” that connects the frogs and allows them to execute such a sequence of hops from the starting points to the terminal points of their sequences. The discrete Frechet distance can be computed in $O(mn)$ time by a straightforward dynamic programming algorithm. We present ...

118 citations

Journal ArticleDOI
TL;DR: Elastic matching techniques are classified according to the type of 2DW and the properties of each class are outlined, and several topics around EM, such as the category-dependent deformation tendency of handwritten characters, are discussed.
Abstract: This paper presents a survey of elastic matching (EM) techniques employed in handwritten character recognition. EM is often called deformable template, flexible matching, or nonlinear template matching, and defined as the optimization problem of two-dimensional warping (2DW) which specifies the pixel-to-pixel correspondence between two subjected character image patterns. The pattern distance evaluated under optimized 2DW is invariant to a certain range of geometric deformations. Thus, by using the EM distance as a discriminant function, recognition systems robust to the deformations of handwritten characters can be realized. In this paper, EM techniques are classified according to the type of 2DW and the properties of each class are outlined. Several topics around EM, such as the category-dependent deformation tendency of handwritten characters, are also discussed.

92 citations


"Comparación cuantitativa de matrice..." refers background in this paper

  • ...Active Shape Models y 2D HMMs son dos buenas técnicas de ejemplos [10]....

    [...]

  • ...De manera general, en [10] se menciona que las estrategias para obtener una solución óptima global proveen resultados más precisos que aquellas soluciones que son sub-óptimas....

    [...]

Journal ArticleDOI
TL;DR: The problem of establishing the resemblance of two images is shown to be NP-complete by reduction from 3-SAT, thus giving evidence that the known exponential time algorithms are justified, but approximation algorithms or simplifications are necessary.

81 citations


"Comparación cuantitativa de matrice..." refers background in this paper

  • ...EM es un problema que presenta una complejidad computacional NP-Completo [7] debido a los grados de libertad que poseen las matrices....

    [...]

Proceedings ArticleDOI
06 Jan 2013
TL;DR: This work presents the first subquadratic algorithm for computing the discrete Frechet distance between two sequences of points in the plane, and uses the geometry of the problem in a subtle way to encode legal positions of the frogs as states of a finite automaton.
Abstract: The Frechet distance is a similarity measure between two curves A and B that takes into account the location and ordering of the points along the two curves: Informally, it is the minimum length of a leash required to connect a dog, walking along A, and its owner, walking along B, as they walk without backtracking along their respective curves from one endpoint to the other.The discrete Frechet distance replaces the dog and its owner by a pair of frogs that can only reside on n and m specific stones on the curves A and B, respectively. These frogs hop from one stone to the next without backtracking, and the discrete Frechet distance is the minimum length of a "leash" that connects the frogs and allows them to execute such a sequence of hops. It can be computed in quadratic time by a straightforward dynamic programming algorithm.We present the first subquadratic algorithm for computing the discrete Frechet distance between two sequences of points in the plane. Assuming m ≤ n, the algorithm runs in O(mn log log n/log n) time, in the standard RAM model, using O(n) storage. Our approach uses the geometry of the problem in a subtle way to encode legal positions of the frogs as states of a finite automaton.

33 citations

Trending Questions (1)
What is the best way to compare two matrices?

The paper presents a modern technique called "distancia Frechet Moderno" for comparing two matrices. This technique considers all data in the matrices globally, rather than just analyzing extracted features.