Scalable web data extraction for online market intelligence

La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extrac...

Descrición completa

Gardado en:
Detalles Bibliográficos
Outros autores: Baumgartner Robert, Gottlob Georg, Herzog Marcus, Penn State University
Formato: Libro
Idioma:inglés
Subjects:
Acceso en liña:Scalable web data extraction for online market intelligence
Tags: Engadir etiqueta
Sen Etiquetas, Sexa o primeiro en etiquetar este rexistro!
Descripción
Summary:La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extraccin̤ de datos. Requieren tareas de navegacin̤ y extraccin̤ sofisticadas altamente parametrizadas. Es necesaria una limpieza de datos sobre la marcha para identificar productos iguales de proveedores distintos. Debe ser posible definir de manera fluida escenarios de flujo de datos que surjan, filtros de datos extrad̕os que se originen de varios sitios web y almacenamiento de los datos resultantes en un deps̤ito que permita someterlos a anl̀isis de inteligencia de mercados.En este artc̕ulo los autores muestran cm̤o Lixto ha superado cada uno de los retos mencionados al mejorar y extender su software original de extraccin̤ de datos. Asimismo, se presenta cm̤o se logr ̤la escalabilidad a travš de la computacin̤ en la nube. Tambiň se exhibe un estudio de caso a partir del mercado de computadores y productos electrn̤icos.