Scalable web data extraction for online market intelligence

La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extrac...

詳細記述

保存先:
書誌詳細
その他の著者: Baumgartner Robert, Gottlob Georg, Herzog Marcus, Penn State University
フォーマット: 図書
言語:英語
主題:
オンライン・アクセス:Scalable web data extraction for online market intelligence
タグ: タグ追加
タグなし, このレコードへの初めてのタグを付けませんか!
その他の書誌記述
要約:La inteligencia de mercados en ln̕ea (online market intelligence, OMI), en particular la inteligencia competitiva para fijar precios de productos, es un r̀ea de aplicacin̤ muy importante para extraccin̤ de datos de internet. Sin embargo, la OMI presenta retos significativos para tecnologa̕ de extraccin̤ de datos. Requieren tareas de navegacin̤ y extraccin̤ sofisticadas altamente parametrizadas. Es necesaria una limpieza de datos sobre la marcha para identificar productos iguales de proveedores distintos. Debe ser posible definir de manera fluida escenarios de flujo de datos que surjan, filtros de datos extrad̕os que se originen de varios sitios web y almacenamiento de los datos resultantes en un deps̤ito que permita someterlos a anl̀isis de inteligencia de mercados.En este artc̕ulo los autores muestran cm̤o Lixto ha superado cada uno de los retos mencionados al mejorar y extender su software original de extraccin̤ de datos. Asimismo, se presenta cm̤o se logr ̤la escalabilidad a travš de la computacin̤ en la nube. Tambiň se exhibe un estudio de caso a partir del mercado de computadores y productos electrn̤icos.