監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉
張家界網(wǎng)站建設(shè)公司

當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 湖南OA系統(tǒng) > 張家界OA > 張家界網(wǎng)站建設(shè)公司

bing核心搜索:網(wǎng)址查詢、追蹤鏈接和相關(guān)搜索

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

題記:這是一篇來(lái)自Bing核心搜索研發(fā)部經(jīng)理的一篇文章,本文講訴了Bing的一系列功能改進(jìn),這只是一篇普通的搜索功能改進(jìn)介紹,但通讀本文, 我們會(huì)發(fā)現(xiàn),搜索引擎會(huì)把大量精力放在研究人們?cè)谒阉鲿r(shí)犯的錯(cuò)、如何正確理解用戶的意圖、以及利用詞庫(kù)提供更精準(zhǔn)的內(nèi)容上面。所以盧松松相信,無(wú)論是bing、Google還是百度,都會(huì)這么做。

在Bing,我們承諾提供最好的搜索結(jié)果, 雖然研究小組數(shù)據(jù)挖掘?qū)<?,在不斷提供我們的核心拼?xiě)和排名算法,可現(xiàn)實(shí)是總有某些歷史上的遺留下的缺陷,這部分是因?yàn)槿藗冞^(guò)于依賴搜索所犯的錯(cuò)誤,在這篇文章中,我的同事Bill Ramsey(Bing的研發(fā)部經(jīng)理),將從三個(gè)方面介紹缺陷的發(fā)生率和嚴(yán)重性:網(wǎng)址查詢、追蹤鏈接和相關(guān)搜索。

網(wǎng)址查詢常見(jiàn)的錯(cuò)誤

這 是搜索缺陷的主要來(lái)源之一,涉及到我們所說(shuō)的網(wǎng)址查詢,例如“facebook.com”或“雅虎網(wǎng)站/郵箱”的查詢,乍一看,你可能會(huì)認(rèn)為這是一個(gè)簡(jiǎn)單 的問(wèn)題。畢竟搜索引擎(Bing)包含數(shù)十億網(wǎng)址,找到一個(gè)匹配的網(wǎng)站沒(méi)多少難度。但在現(xiàn)實(shí)中,這種類(lèi)型的查詢實(shí)際上相當(dāng)復(fù)雜。因?yàn)槲覀兯腥藭?huì)用無(wú)數(shù)的 拼寫(xiě)與變體。

例如,“facebook.com”就有上千個(gè)不同的變體,如“facebookc.om”,“facbook.com”,和 “ww.faceboo.omc”,除了這類(lèi)拼寫(xiě)錯(cuò)誤外,人們并不總是知道正確的URL。例如西南航空公司是southwest.com,但有些人試圖搜 “swair.com”達(dá)到該公司的網(wǎng)頁(yè)。同時(shí),我們通??吹降木W(wǎng)址,如“雅虎網(wǎng)站/郵箱”時(shí),正確是URL是“mail.yahoo.com”的排列。

即使我們找出了你真正的搜索意圖,但惡意網(wǎng)址或垃圾郵件發(fā)送者提出了另一個(gè)挑戰(zhàn)。它們獵取頂級(jí)域名對(duì)象如coolmathgames.com(人實(shí)際上是為coolmath-games.com)的URL。

這是我們的缺陷,我們主要通過(guò)三個(gè)領(lǐng)域來(lái)解決這類(lèi)錯(cuò)誤的查詢方法:

第一, 正確識(shí)別URL,我們可以就遮擋,通過(guò)確定的網(wǎng)址,我們避免如包括像searscardcom.com垃圾結(jié)果的問(wèn)題。

第二, 進(jìn)行模擬用戶錯(cuò)誤測(cè)試,通過(guò)數(shù)十億的原模型,我們能夠解決常見(jiàn)的拼寫(xiě)錯(cuò)誤的網(wǎng)址。

第三, 我們會(huì)分析,尋找像“swair.com”網(wǎng)站,使用戶最終將結(jié)束預(yù)定網(wǎng)站“southwest.com”。

另 一個(gè)例子,適用于機(jī)器學(xué)習(xí)模式,像“facebooklogin.com” 的查詢相當(dāng)于 “facebooklogin.net”,這是很常見(jiàn)的域名后綴輸入錯(cuò)誤。此外,像“bed bath and beyond.com” 輸入成 bedbathandbeyond.com。我們的模型已經(jīng)適應(yīng)了這些變化,會(huì)主動(dòng)把搜索結(jié)果修改,下面的例子是facebook的用戶:

刪除多余追蹤的相關(guān)鏈接

搜索引擎的關(guān)鍵功能之一,是查詢執(zhí)行拼寫(xiě)和查詢擴(kuò)展的組件,拼寫(xiě)會(huì)糾正數(shù)百個(gè)錯(cuò)誤的查詢,而搜索出現(xiàn)的詞組(下面的查詢框,表明我們改變了用戶的查詢),我 們把這種改建作為“追索”。例如,如果你輸入“關(guān)于成功英雄的事跡”,我們將顯示“包括引號(hào)的成功的英雄事跡”,但我們可能只顯示“關(guān)于成功的英雄和事 跡”,我們會(huì)架設(shè)所有關(guān)于你的意圖。

在過(guò)去,我們用同義詞作為我們追蹤鏈接的一部分,但會(huì)經(jīng)常導(dǎo)致搜索結(jié)果偏離主題,導(dǎo)致同義詞追蹤成為多余的功能, 所有我們?cè)诓粩鄶U(kuò)大“詞語(yǔ)”的定義,幫助其用戶更好的進(jìn)行匹配。

所以這項(xiàng)功能我們已經(jīng)刪除,這個(gè)附加的價(jià)值不大,當(dāng)Bing改變一些同義詞的話,追蹤鏈接可能不可能添加更多的有價(jià)值的信息,所以我們將搜索結(jié)果的顏色改為黑色。我們將繼續(xù)努力為用戶指定的搜索詞語(yǔ)提供更好的查詢。

改進(jìn)相關(guān)搜索

相關(guān)搜索,這個(gè)大家很熟悉,在人們初始搜索時(shí),我們會(huì)把相關(guān)的搜索防止搜索結(jié)果左側(cè),現(xiàn)在調(diào)整到右側(cè),例如搜索“布拉德·皮特”:

(注:Bing中國(guó)版還沒(méi)有變,百度和Google在底部。)

有時(shí)我們會(huì)查詢搜索結(jié)果的題外話。例如“AMD”會(huì)給用戶提供意想不到的搜索結(jié)果,通過(guò)改善我們的相關(guān)模型。

同時(shí),我們也取得了其他地方改進(jìn),超越有關(guān)相關(guān)搜索中的格式條款,即“KSN WeatherLab” 中的 “KSN Weather Lab”,(注:一些實(shí)驗(yàn)性項(xiàng)目,處于測(cè)試階段),并避免在安全搜索中檢索到成人內(nèi)容。

結(jié)論:

搜索引擎的有點(diǎn)在于它會(huì)始終依賴于人,而人們總會(huì)有不同缺陷的,我們做的是降低缺陷率和搜索率,希望人們可以做更少的搜索并做更多的事。

作者:Dr. William Ramsey—— bing核心搜索研發(fā)部首席開(kāi)發(fā)經(jīng)理

發(fā)布:2007-03-31 14:20    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)欄目:
相關(guān)文章:
張家界OA
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢

泛普張家界網(wǎng)站建設(shè)公司其他應(yīng)用

張家界軟件開(kāi)發(fā)公司 張家界門(mén)禁系統(tǒng) 張家界物業(yè)管理軟件 張家界倉(cāng)庫(kù)管理軟件 張家界餐飲管理軟件 張家界網(wǎng)站建設(shè)公司