可以說(shuō),公共互聯(lián)網(wǎng)是世界上最大的信息來(lái)源。但是,在線(xiàn)信息的結(jié)構(gòu)通常不適合以編程方式解析或獲得洞察力。這就是網(wǎng)絡(luò)數(shù)據(jù)提取可以發(fā)揮作用的地方。
公共網(wǎng)絡(luò)是 Diffbot 知識(shí)圖譜的底層來(lái)源,它展示了將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為信息和上下文(知識(shí))的一種途徑。
對(duì)于需要更頻繁地構(gòu)建 Web 的特定部分或?qū)で笞远x值的團(tuán)隊(duì),Web 數(shù)據(jù)提取可以提供更直接、更有影響力的數(shù)據(jù)源。
Diffbot 的 Crawlbot 與我們的自動(dòng)提取 API 結(jié)合使用,使您能夠快速、重復(fù)地抓取所有常見(jiàn)的頁(yè)面類(lèi)型,并從以前未結(jié)構(gòu)化的數(shù)據(jù)中獲得洞察力。
使用機(jī)器視覺(jué)和自然語(yǔ)言處理,我們的網(wǎng)絡(luò)數(shù)據(jù)提取套件可以將公共網(wǎng)站轉(zhuǎn)換為用于新聞監(jiān)控、市場(chǎng)情報(bào)、電子商務(wù)使用或機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)的上下文數(shù)據(jù)源。
原文鏈接:https://blog.diffbot.com/knowledge-graph-glossary/knowledge-as-a-service/