Scalable web data extraction for online market intelligence
La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extrac...
Saved in:
| Other Authors: | , , , |
|---|---|
| Format: | Book |
| Language: | English |
| Subjects: | |
| Online Access: | Scalable web data extraction for online market intelligence |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Summary: | La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extraccin̤ de datos. Requieren tareas de navegacin̤ y extraccin̤ sofisticadas altamente parametrizadas. Es necesaria una limpieza de datos sobre la marcha para identificar productos iguales de proveedores distintos. Debe ser posible definir de manera fluida escenarios de flujo de datos que surjan, filtros de datos extrad̕os que se originen de varios sitios web y almacenamiento de los datos resultantes en un deps̤ito que permita someterlos a anl̀isis de inteligencia de mercados.En este artc̕ulo los autores muestran cm̤o Lixto ha superado cada uno de los retos mencionados al mejorar y extender su software original de extraccin̤ de datos. Asimismo, se presenta cm̤o se logr ̤la escalabilidad a travš de la computacin̤ en la nube. Tambiň se exhibe un estudio de caso a partir del mercado de computadores y productos electrn̤icos. |
|---|