Scalable web data extraction for online market intelligence

La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extrac...

Disgrifiad llawn

Wedi'i Gadw mewn:
Manylion Llyfryddiaeth
Awduron Eraill: Baumgartner Robert, Gottlob Georg, Herzog Marcus, Penn State University
Fformat: Llyfr
Iaith:Saesneg
Pynciau:
Mynediad Ar-lein:Scalable web data extraction for online market intelligence
Tagiau: Ychwanegu Tag
Dim Tagiau, Byddwch y cyntaf i dagio'r cofnod hwn!
Disgrifiad
Crynodeb:La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extraccin̤ de datos. Requieren tareas de navegacin̤ y extraccin̤ sofisticadas altamente parametrizadas. Es necesaria una limpieza de datos sobre la marcha para identificar productos iguales de proveedores distintos. Debe ser posible definir de manera fluida escenarios de flujo de datos que surjan, filtros de datos extrad̕os que se originen de varios sitios web y almacenamiento de los datos resultantes en un deps̤ito que permita someterlos a anl̀isis de inteligencia de mercados.En este artc̕ulo los autores muestran cm̤o Lixto ha superado cada uno de los retos mencionados al mejorar y extender su software original de extraccin̤ de datos. Asimismo, se presenta cm̤o se logr ̤la escalabilidad a travš de la computacin̤ en la nube. Tambiň se exhibe un estudio de caso a partir del mercado de computadores y productos electrn̤icos.