2009互聯(lián)網(wǎng)大會(huì )會(huì )于11月2日至3日在北京召開(kāi),騰訊科技作為官方指定戰略合作門(mén)戶(hù)網(wǎng)站、官方指定*合作新聞中心進(jìn)行全方位的視頻、圖文采訪(fǎng)與直播。特設立4個(gè)現場(chǎng)專(zhuān)訪(fǎng)間,力邀業(yè)界專(zhuān)家與企業(yè)代表剖析產(chǎn)業(yè)現狀,暢談產(chǎn)業(yè)前景,并就金融危機一年來(lái)的發(fā)展進(jìn)行深度解讀。
以下是中搜總裁陳沛演講實(shí)錄:
陳沛:各位領(lǐng)導、各位來(lái)賓,大家下午好!很高興能夠在一年一度的*互聯(lián)網(wǎng)大會(huì )上和大家分享對互聯(lián)網(wǎng)的看法,另外搜索引擎相當長(cháng)的時(shí)間應該說(shuō)是互聯(lián)網(wǎng)的熱點(diǎn)。今天我的主題是關(guān)于第三代搜索引擎的。有很多人說(shuō)中搜為什么最近不說(shuō)很多話(huà)了?今天我也想跟大家匯報一下中搜在搜索方面的探索。
2003年的時(shí)候,我提出了第三代搜索的思想,當時(shí)我們雖然全力以赴在做第二代搜索,我們當時(shí)認為最早的搜索引擎是雅虎,上面有很多分類(lèi)把網(wǎng)站和類(lèi)別進(jìn)行劃分,現在我們談到搜索會(huì )想起Google,在輸入框里面打進(jìn)一個(gè)關(guān)鍵詞。
未來(lái)是什么樣?中搜一直在嘗試新一代的搜索,最近網(wǎng)上有很多關(guān)于第三代搜索的討論,因為很多公司都在嘗試一些搜索進(jìn)行,雖然關(guān)于第三代搜索大家沒(méi)有什么結論,但是很多人都引用了前兩代的結果,以雅虎目錄為代表導航的搜索和以Google為代表的關(guān)鍵詞收入。
搜索一定會(huì )發(fā)生某種變革,一個(gè)是持續增長(cháng)的互聯(lián)網(wǎng)數據。5年前的今天互聯(lián)網(wǎng)數據大大增長(cháng),每天以幾何數據增長(cháng)。我們單純用技術(shù)的方式找到*的結果變得越來(lái)越困難,現在的搜索引擎主要是基于一些算法,在700萬(wàn)個(gè)結果中迅速做一個(gè)排序,讓我們有機會(huì )在前幾頁(yè)中看到你需要的東西。如果互聯(lián)網(wǎng)的內容越來(lái)越多,我們如何提煉前兩頁(yè),會(huì )變得越來(lái)越困難。
第二,用戶(hù)實(shí)際上也在進(jìn)化,5年前我們在互聯(lián)網(wǎng)上搜索幾百條信息,大家就很滿(mǎn)意了,但是現在每一結果甚至有上百萬(wàn),但是很遺憾人的搜索能力有限,只能看前幾頁(yè)。用戶(hù)的能力不斷地細分,搜索的本質(zhì)是用最短的時(shí)間得到自己想要的東西,而不一定是越多越好,搜索本身就是這樣的。根據這兩點(diǎn),搜索一定會(huì )發(fā)生某種變革。
其實(shí)我們最近也能看到關(guān)于第二代搜索引擎的代表,他們也在嘗試做搜索的變革。*個(gè)是Google,Google正在做整合搜索,他們使很多的垂直搜索整合在一個(gè)界面中。百度最近在推“框計算”,當然我們不是說(shuō)所有的搜索都在一個(gè)框里面,但是“框計算”允許第三方的搜索引擎成為它的結果的一部分。某種程度上,這個(gè)和中搜的想法一致,中搜做了兩件事,一個(gè)是開(kāi)放,一個(gè)是聚合。
我們認為第三代搜索的本質(zhì)一個(gè)是多方支持的融合,不僅僅是搜索引擎公司,因為搜索引擎公司掌握的能力是有限的。我們更多的是大數量處理能力。但是很多專(zhuān)業(yè)領(lǐng)域我們不具備這種知識。某種意義上我們希望搜索質(zhì)量更高,可能需要更多、更專(zhuān)業(yè)的知識,這種搜索的結果需要有更專(zhuān)業(yè)的方式做,需要有一種合作的方式融合一種新的知識,當然它會(huì )變得更加專(zhuān)業(yè)化,包括領(lǐng)域化和更加個(gè)性化,這是我們認為新搜索可能體現的一些本質(zhì)。
這里有一個(gè)關(guān)于張靚穎的頁(yè)面,左上角是她的簡(jiǎn)介,來(lái)自于維基百科。其中有一個(gè)關(guān)于張靚穎的個(gè)人的新聞和張靚穎在新浪寫(xiě)的圖片、博客和音樂(lè ),所有和她有關(guān)的東西完全被聚合在這一個(gè)頁(yè)面上,這些內容每天自動(dòng)更新。它看起來(lái)是一個(gè)門(mén)戶(hù),但是本質(zhì)上是一個(gè)互聯(lián)網(wǎng),另外是一個(gè)被人加工的用新的方式呈現出來(lái)的。
拼裝一個(gè)頁(yè)面,不需要學(xué)習什么知識,它可以按照自己的理解把互聯(lián)網(wǎng)的數據重新整合和展示,這也是我們認為的新一代搜索的新的條件,因為大部分沒(méi)有能力利用計算機的技術(shù)再架構這些數據,他們希望用簡(jiǎn)單的方式再去構造自己的知識。
所以我們認為基于開(kāi)放的平臺,應該使普通用戶(hù)參與這些內容成為一個(gè)可能。所以中搜這幾年主要做的是開(kāi)放的平臺。當然所有的內容都必須由一個(gè)用戶(hù)加工整理,它的覆蓋面也會(huì )非常有限。
這里是一個(gè)貴州茅臺的主頁(yè),和貴州茅臺有關(guān)的股票信息、行業(yè)信息包括它的論壇都在一個(gè)頁(yè)面上。當然這個(gè)東西做好的話(huà),它也有快速復制的能力,所有的股票都會(huì )被復制出來(lái),所以在財經(jīng)的搜索里面,你可以看到針對所有個(gè)股的更完整、更及時(shí)的頁(yè)面,當然它可能會(huì )成為新的搜索潛力。
當然搜索引擎的質(zhì)量標準也不一樣了,在新的搜索上,我們會(huì )提出更新的指標要求,比如說(shuō)內容依然要全面,只是有更好的展示方式,它可能要更加準確,比如說(shuō)我們要查自己的名字,我們會(huì )發(fā)現整個(gè)搜索引擎會(huì )給你一堆與關(guān)鍵詞相匹配的內容,但是不是你想找的人。
現在第二代的搜索引擎某種意義上只是關(guān)鍵詞搜索的匹配,離我們真正要找的內容有距離,對人顯而易見(jiàn)的事,對機器來(lái)說(shuō)是很困難的。所以我們看到很多不是我們需要的內容。如果有人的知識參與,這個(gè)結果可能會(huì )變得更加準確。
現在的搜索引擎只是一個(gè)關(guān)鍵詞的匹配,它并不是一個(gè)智慧的關(guān)聯(lián),對未來(lái)說(shuō)我們有更高的要求,我們希望描述的內容就是我們想要的內容,而不僅僅是關(guān)鍵詞的匹配。因為是一個(gè)門(mén)戶(hù)的展示方式,可以有一個(gè)好的方式,可以有一個(gè)美觀(guān)的展示方式。所以這里面可能有新的標準。
這是《五星大飯店》是海巖的著(zhù)作,所有的內容重新加工整理,依然覆蓋互聯(lián)網(wǎng)的各種內容,它的內容被加工和組織,以一種嶄新的方式嶄新出來(lái),我想可能更多人愿意閱讀這樣的頁(yè)面。
開(kāi)放的本質(zhì)實(shí)際上就是專(zhuān)業(yè)技術(shù)的融合,這也是第三代搜索引擎的本質(zhì),也是中搜這幾年做的主要的工作。大家可以看到,在底層有各種各樣的數據庫,再往上是數據流,再往上是搜索的引擎,包括搜索的引擎,內容研發(fā)的引擎,包括web服務(wù)的引擎,當然這些東西對于大部分人來(lái)說(shuō)可能都是陌生的、困難的。
中搜第三代開(kāi)放的搜索引擎,在于這個(gè)平臺上可以簡(jiǎn)單地與合作伙伴構造新的垂直搜索,比如我們和方正合作做圖書(shū)的垂直搜索,還有番薯網(wǎng)是我們和方正合作的一個(gè)產(chǎn)品。它就是中搜的第三代搜索結合了方正對數字圖書(shū)的理解,構建出的一個(gè)新的搜索和服務(wù)。
當然我們還可以和賽迪合作,也可以和專(zhuān)業(yè)領(lǐng)域擅長(cháng)并且有愿望的人合作一個(gè)新的垂直搜索,這些垂直搜索共同構造了新的搜索,他們可以向現代的互聯(lián)網(wǎng)提供某種專(zhuān)業(yè)的內容?,F在的搜索引擎某種意義上可能是整個(gè)搜索引擎發(fā)展的必由之路。開(kāi)放成為一個(gè)大的趨勢。
第三方搜索本質(zhì)的含義是什么?我現在搜索的一部分的結果可能不如別人做得更好,或者是別人的搜索可能成為我搜索的一部分,某種基礎上也是對專(zhuān)業(yè)知識的一種認同。這是我介紹的關(guān)于第三代搜索引擎整體的思想,它體現了所謂的“開(kāi)放”的思想。另外為了開(kāi)放,必須有非常好的個(gè)性化的平臺,可以非常簡(jiǎn)單地和不同的合作伙伴構造不同的垂直搜索,這是最近這年中搜做的主要的工作。
對于大部分的合作伙伴來(lái)說(shuō),底下那些復雜的,我們不太了解的和陌生的技術(shù)都不見(jiàn)了,只剩下一個(gè)開(kāi)放的平臺。按照自己的意愿構造自己的服務(wù)和搜索。
這是我們跟方正合作的番薯網(wǎng),這是從番薯網(wǎng)里面看到的各個(gè)頁(yè)面,都是中搜底層的技術(shù)構造的,無(wú)論從內容和形式來(lái)說(shuō)都完全是一個(gè)垂直的領(lǐng)域。這是女性的頻道。這是關(guān)于一個(gè)作家的所有的內容。
當然也可以是與出版社相關(guān)的內容。這里面我們很難區分它是一個(gè)圖書(shū)的應用還是搜索引擎,因為這里面很多的內容來(lái)自于互聯(lián)網(wǎng),當它應該出現的時(shí)候就自動(dòng)出現了,所以我們并不贊成再一個(gè)輸入框里面實(shí)時(shí)獲取一個(gè)信息的全部,我甚至說(shuō)過(guò)比較極端的話(huà),未來(lái)若干年人的所有信息都再一個(gè)輸入框里面獲得,那是人類(lèi)的悲哀,因為搜索應該和所有的應用結合在一起。有時(shí)候你很難區分電子商務(wù)和搜索引擎,他們無(wú)處不在。