Scalable web data extraction for online market intelligence

La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extrac...

Повний опис

Збережено в:
Бібліографічні деталі
Інші автори: Baumgartner Robert, Gottlob Georg, Herzog Marcus, Penn State University
Формат: Книга
Мова:Англійська
Предмети:
Онлайн доступ:Scalable web data extraction for online market intelligence
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Опис
Резюме:La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extraccin̤ de datos. Requieren tareas de navegacin̤ y extraccin̤ sofisticadas altamente parametrizadas. Es necesaria una limpieza de datos sobre la marcha para identificar productos iguales de proveedores distintos. Debe ser posible definir de manera fluida escenarios de flujo de datos que surjan, filtros de datos extrad̕os que se originen de varios sitios web y almacenamiento de los datos resultantes en un deps̤ito que permita someterlos a anl̀isis de inteligencia de mercados.En este artc̕ulo los autores muestran cm̤o Lixto ha superado cada uno de los retos mencionados al mejorar y extender su software original de extraccin̤ de datos. Asimismo, se presenta cm̤o se logr ̤la escalabilidad a travš de la computacin̤ en la nube. Tambiň se exhibe un estudio de caso a partir del mercado de computadores y productos electrn̤icos.