1. 程式人生 > >這是三篇影響百度17年的技術部落格,作者李彥巨集

這是三篇影響百度17年的技術部落格,作者李彥巨集

640?wx_fmt=jpeg


來源 | DoNews

作者 | 李彥巨集


我與GO.COM


本文寫於2001年2月3日

       

雖然早已是預料之中的事,但得知GO.COM關閉的訊息時,還是有些傷感,畢竟我為她和她的前身Infoseek工作了兩年半之久。是的,兩年半在因特網這一行是很長的時間! 人都是有惰性的,我也不例外,自從1997年加入Infoseek後,我是很認真的,我曾經立下誓言,只要我在Infoseek一天,就要保住她搜尋引擎在業界第一的位置。


頭半年,我日以繼夜地工作,終於在1998年4月釋出了ESP技術,這是世界主要搜尋引擎中首次採用超鏈分析技術,此後的三年中,各大搜索引擎陸續採用了這一思路。 


那個時候也正是早期網路公司從搜尋引擎向入口網站過渡的時期,Hotmail的興起,使得各個門戶競相效仿。Lycos推出了以lycosmail.com結尾的免費郵箱,可能是excitemail.com已被他人搶注了的緣故,Excite推出的免費郵箱是以mailexcite.com 結尾的。


雅虎和Infoseek也在緊鑼密鼓地籌備,我為自己的公司在這一方面出手較晚而焦慮,於是提出我們的免費郵箱要以infoseek.com結尾,這樣我們的免費郵箱就比競爭對手的要好記得多,因為畢竟那時候上網的人誰不知道Infoseek!


然而那些來自傳統行業的,自己也沒上過幾天網的決策者堅持認為這樣做會導致公眾以為那些免費郵箱的使用者是的Infoseek僱員,如果他們用這樣的郵件地址傳送什麼不得體的東西的話,人家會來起訴Infoseek。他們甚至提出如果這樣可行的話,Excite和Lycos為什麼沒這樣做——整個一個跟風者的心態!


我提出美國線上的例子,人家的客戶郵箱就是以aol.com結尾的嗎!但遭到的反駁是:美國線上是ISP,所以別人不會有誤解。我說當人們習慣了Infoseek的免費郵箱之後,也就不會有誤解了;但決策者還是不願意承擔任何潛在法律糾紛的風險。


 幾天以後,雅虎推出了免費郵箱,正是以yahoo.com結尾的!雅虎本身的員工從此開始起用yahoo-inc.com的電子郵件。然而這並沒能改變決策者使用infoseekmail.com的決定。


後來的事情大家都知道了,Excite和Lycos都把他們的免費郵箱改成了與他們公司品牌一致的地址,而infoseekmail.com卻從來沒有推出過。


沒有推出的原因是因為98年4月迪斯尼參股Infoseek,給了一點錢,好象是7000萬,然後把沒上市,也幾乎永遠要虧錢的Starwave強行賣給了Infoseek,迪斯尼信誓旦旦地要把Infoseek和它所有的網站資源整合到一個新的網際網路品牌之下,就是後來的 GO.COM。


訊息宣佈的時候,Infoseek上上下下都很興奮,覺得這回算是有靠山了,雅虎算什麼,世界上90%的人都知道迪斯尼的品牌,迪斯尼在品牌建設上是大師,而雅虎最多算是個初出茅廬了毛頭小夥!那時候沒有人想到,僅僅一年多以後,華爾街就有了毛頭小夥要收購品牌大師的傳言! 


我對迪斯尼的進駐並沒有特別激動,直覺告訴我,背上迪斯尼這個包袱,我們就再也不能象一個網際網路公司那樣,高速、靈活地奔跑了。


所以我對朋友們說,這件事情相當於我們買了個保險,不會倒閉了,現在這個預言應驗了,GO.COM的股票即將被置換成迪斯尼的股票,幾乎永遠不會死掉,也永遠不會令人激動了。1898年9月,Infoseek和迪斯尼對外宣佈了GO.COM這個名字,不久又展示了據說是迪斯尼CEO欽定的GO.COM標識,就是那個後來被人起訴的黃底綠芯的交通燈標識。


Goto.com看到這個標識後覺得有機可乘,提出要迪斯尼賠償。在品牌領域高處不勝寒的迪斯尼 哪把小小的goto放在眼裡,迪斯尼甚至覺得他們不屑於收購這樣的公司。


而事實上,一年以後,goto的股票市值比GO.COM還高! 經過10個月的整合(10個月在網際網路時代意味著什麼,同志們!),GO.COM在99年1月正式釋出,所提供的免費郵件也自然地使用了以go.com結尾的地址——而那位拍板要用Infoseekmail.com地址的人,被任命為GO.COM網站的總經理! 


GO.COM的問題很快就顯露出來了,作為網際網路公司的Infoseek和作為傳統公司的迪斯尼在公司運作上有著太多的分歧,而迪斯尼是從不妥協的,當然這並不意味著它總是對的。此後8個月的同床異夢使得Infoseek的創始人下決心把公司完全賣給迪斯尼。


訊息宣佈是在1999年8月,Infoseek的股票在11月份轉成了GO.COM的股票,Infoseek這網際網路產業的先驅從此在華爾街消失了。雖然此後很長的時間中,人們還是通過鍵入www.infoseek.com來訪問GO.COM,但是Infoseek這個品牌卻被逐步地扼殺了。


在矽谷,沒有人願意為傳統的大公司工作,迪斯尼連這點也不理解,他們甚至認為大家應該為成為迪斯尼的一員而感到驕傲。但事實還是事實,迪斯尼必須用許諾很多現金獎勵的辦法來換取人們在GO.COM多呆幾個月的承諾。


迪斯尼從一開始就低估了在網際網路上重新建立一個大眾品牌的難度,犧牲Infoseek的品牌並不意味著迪斯尼的GO.COM會建立起來,在傳統行業屢試不爽的品牌策略卻在網上一籌莫展。再加上官司纏身,標識被迫改動,並賠款求和,帶著迪斯尼這樣沉重的翅膀的GO.COM再也沒有能夠飛起來過。 


總結這段經歷,我覺得自己雖然是做技術的出身,但在很多商業性的判斷上有一定的悟性,比如在免費郵件的地址問題,GO.COM的前途問題等,這為我後來建立公司帶來了很大的信心。經歷了這麼多,我想GO.COM/Infoseek的很多失誤應該不會在百度重演。 


以上文字全憑記憶,引用資料未經核實,表達的觀點純屬個人觀點,如有冒犯,還請見諒。


640?wx_fmt=jpeg


入口網站與企業網站的區別—— 給網站整合商


本文寫於2001年4月17日


2000年9月,原Infoseek公司的CTO William Chang博士訪華,我要求他對中國網際網路的核心競爭力做一個報告。一下飛機,我們就談上了“正事兒”。沒想到他問我的第一個問題居然是“中國網際網路領域是不是有很多諮詢公司?”我回答說“不多。”


他對這個回答表示了一定程度的擔心。他認為,如果諮詢公司不成氣候的話,作為技術提供商的百度在商業上會面臨挑戰。William後來作的報告,居然很大的篇幅是講在每一次技術革命中,諮詢業對技術所起的推動作用。從文藝復興,一直到美國網際網路,無一例外。


網際網路時代的所謂諮詢公司,其實指的主要是網站整合商,當然也包括像時代財富、網際網路實驗室等中文意義上的諮詢顧問公司。令人欣慰的是,隨著dotcom泡沫的消失,原來很多做門戶的網站,開始轉型做網站整合,把他們做網站的經驗,轉移到為公司企業和政府機構做網站上來了。


是啊,沒有主流單位(或稱“傳統行業”)的參與,怎麼能說我們已經進入了網際網路時代呢!當然,更多的情況是原來做系統整合的公司,開始大舉進兵網站整合。有了這樣一個網站整合的群體,就為百度的成功增添了新的基礎。


沒有太多的人注意到,上個星期百度和戴爾、搜狐、亞信等公司一起舉辦了一個“大型企業門戶應用解決方案”的研討會,其主要的參會者都是網站整合商。這些代表新經濟的公司,無一例外地看中了網站整合這一塊兒,希望通過他們把主流行業帶入網路經濟。 


人們對入口網站可能再熟悉不過了,然而企業網站和入口網站所起的作用是有很大差別的,入口網站的特點,套用新浪的王志東的話,叫做“遊戲化”的成分多些,聊天室、從各個傳統媒體摘錄來的新聞、網上游戲、BBS等,不一而足。這些對企業網站都不適用。


當一個人到一個入口網站上去的時候,他可能根本沒有什麼目的,他往往會跟著那些網頁上的超鏈信馬由繮地走下去,直到他需要離網的時候。這樣做,即使花費很多時間,他可能也不會抱怨這個網站。當人們到企業網站去的時候,他們往往代有很強的目的性,而最可能的目的是什麼? 尋找資訊! 


一件真事:有一次出差,想找離賓館最近的我開戶的銀行,於是上網,先去了這個銀行的網站,花了足足十分鐘,卻找不到需要的資訊,這個網站雖然有一個搜尋框,但輸入檢索詞後出來的結果是“Internal Server Error”,跟著超鏈找了半天,仍然一無所獲。 


最後去了一家入口網站,輸入檢索詞後,立刻就找到了想要的資訊,而這個載有有用資訊的網頁恰恰就在這家銀行的網站上


我想這並不是一個偶然的事情,當中國的網民越來越成熟的時候,他們必然會問:入口網站能在數千萬的網頁中立即找出需要的網頁,為什麼在一個只有幾千頁的小網站上要找些東西就那麼難呢? 


當一個人在一個企業網站上花費很多時間卻找不到需要的資訊的時候,他會怎麼樣? 他會感到憤怒!有了一個好的站內搜尋引擎,問題就容易得多了,其實當我寫這篇文章的時候,我已經不記得William是什麼時候訪華的了,我根本不需要記住,因為我知道只要我到百度的網站上,輸入"William"這個詞,我就立刻可以找到他訪華的精確時間。願天下企業網站都有一個好的搜尋功能!


640?wx_fmt=jpeg


搜尋引擎的第三定律


本文寫於2001年9月7日


搜尋引擎走到今天,已經是一個結束過去,開闢未來的時候了。為了說清楚我所講的第三定律,我們先來回顧一下第一和第二定律。


第一定律、相關性定律

        

聽起來象是一篇學術論文,的確,就連第一、第二定律的提法以前也沒有過,但是第一、第二定律的內容確早已在業界和學術界得到了公認。


其實這第一定律是早在網際網路出現之前就被學術界廣泛研究過的,那就是所謂的相關性定律。這個領域那時叫情報檢索,或資訊檢索,也有叫全文檢索的。


那時的相關性都是基於詞頻統計的,也就是說,當用戶輸入檢索詞時,搜尋引擎去找那些檢索詞在文章(網頁)中出現頻率較高的,位置較重要的,再加上一些對檢索詞本身常用程度的加權,最後排出一個結果來(檢索結果頁面)。


早期的搜尋引擎結果排序都是基於本文的第一定律的,如Infoseek, Excite, Lycos等,它們基本上是沿用了網路時代之前學術界的研究成果,工業界的主要精力放在處理大訪問量和大資料量上,對相關性排序沒有突破。詞頻統計其實根本沒有利用任何跟網路有關的特性,是前網路時代的技術。


然而,網路時代的主要文獻是以網頁的形式存在的,而幾乎每個人都可以隨心所欲地在網上發表各種內容,詞頻相同的兩個網頁,質量相差可以很遠,可是按照搜尋引擎的第一定律,對這兩個網頁的排序應該是一樣的。為了能夠派在某些檢索結果的前幾位,許多網頁內容的製作者絞盡腦汁,在其頁面上堆砌關鍵詞,搜尋引擎對此防不勝防,苦不堪言。這種情況到了1996年開始有了改變。


第二定律、人氣質量定律

        

1996年4月,我到賭城拉斯維加斯開一個有關資訊檢索方面的學術會議,會議的內容就象拉斯維加斯的天氣一樣,照例比較枯燥乏味。但遠離公司的我,卻難得有一個靜下心來認真思考問題的機會。就在聽一個毫不相干的論文演講時,我突然把科學引文索引的機制跟Web上的超級連結聯絡起來了 —— 感謝北大,她在我上大三的時候就教授了我科學引文索引的機制,美國恐怕沒有一所大學會在你本科的時候教這玩藝兒。


科學引文索引的機制,說白了就是誰的論文被引用次數多,誰就被認為是權威,論文就是好論文。這個思路移植到網上就是誰的網頁被連結次數多,那個網頁就被認為是質量高,人氣旺。在加上相應的連結文字分析,就可以用在搜尋結果的排序上了。這就引出了搜尋引擎的第二定律:人氣質量定律。


根據這一定律,搜尋結果的相關性排序,並不完全依賴於詞頻統計,而是更多地依賴於超鏈分析。我意識到這是一個突破性的東西,回去以後就很快總結了思路,於96年6月申請了這一方面的美國專利。1999年7月6號,美國專利和商標局批准了專利號為5,920,859的,以我為唯一發明人的專利。


大約在1996年底,斯坦福大學計算機系的兩位研究生也想到了同樣的解決方法,他們後來創立了一個叫Google的搜尋引擎,Google的網站上至今仍然說他們的這項技術是Patent-pending(專利申請中),不知道美國專利局是不是還會再批這樣的專利。


Anyway,超鏈分析的方法98年以後逐漸被各大搜索引擎所接受,由於連結是網路內容的一個根本特性,這時候的搜尋引擎才開始真正利用網路時代的檢索技術。

        

世事難料,2000年起網路泡沫迅速破滅,各大搜索引擎要麼遭人收購,要麼推遲上市,所有使用人氣質量定律的搜尋引擎公司都未能倖免。那麼,搜尋引擎的出路到底在哪兒?


第三定律、自信心定律

        

人氣質量定律解決的還是一個技術層面的問題,然而搜尋引擎從誕生的那一天起,從來就不是一個純技術現像,它融合了技術,文化,市場等各個層面的因素。解決搜尋引擎公司的生存和發展問題需要搜尋引擎的第三定律——自信心定律。

        

1998年的時候,沒有太多的人拿一家遠在矽谷500英里以外,剛剛成立的,叫作GOTO.COM的公司當回事兒。它不過是買了一個搜尋引擎的技術服務,然後再向那些網站的擁有者們拍賣他們網站在GOTO檢索結果中的排名,誰付的錢多,誰的網站就排在前面,而且付費是根據網民點選該網站的情況來計算的,僅僅在搜尋結果中出現並不需要付費。這就是自信心定律的最早實踐者!


根據這一定律,搜尋結果的相關性排序,除了詞頻統計和超鏈分析之外,更注重的是競價拍賣。誰對自己的網站有信心,誰就排在前面。有信心的表現就是願意為這個排名付錢。需要宣告的是,自信心定律也是我自己給這一模式起的名字,以前的文獻中並沒有人這樣總結過。

        

今天,在網路業一片蕭條,納斯達克風聲鶴唳的時候,GOTO卻如日中天,市值高達13億美金,收入高達雅虎總收入的35%。反觀入口網站,有哪一個能從它們的搜尋引擎服務中賺出總收入的三分之一呢?


究其原因,就是因為GOTO最早實踐了搜尋引擎的自信心定律。以前的搜尋引擎都是靠CPM來收費的,而CPM是從傳統廣告業借鑑過來的,沒有考慮網路媒體即時性,互動性,易競價的特點,而競價排名,點選收費則是為網站擁有者直接提供銷售線索,而不是傳統意義上的廣告宣傳。自信心定律一改過去搜索引擎靠CPM收錢的尷尬局面,開創了真正屬於網際網路的收費模式。

        

在中國,百度一直致力於推動搜尋引擎市場的培植和發展,現在,我們聯合了各大入口網站的搜尋引擎,一起通過百度的競價排名系統來實踐搜尋引擎的第三定律,為數十萬網站的擁有者提供一個展示自信心,吸引潛在客戶,發現銷售線索的平臺。


(*本文已獲授權)


--【完】--


2018 AI開發者大會


AI技術年度盛會即將開啟!11月8-9日,來自Google、Amazon、微軟、Facebook、LinkedIn、阿里巴巴、百度、騰訊、美團、京東、小米、位元組跳動、滴滴、商湯、曠視、思必馳、第四正規化、雲知聲等企業的技術大咖將帶來工業界AI應用的最新思維。


如果你是某個AI技術領域的專業人才,或想尋求將AI技術整合至傳統企業業務當中,掃碼填寫大會註冊資訊表,我們將從中挑選出20名相關性最高的幸運讀者,送出單場分論壇入場券。大會嘉賓陣容和議題,請檢視文末海報。


640?wx_fmt=png


此外,如果你想與所有參會大牛充分交流溝通,點選閱讀原文購票,使用優惠碼:AI2018-DBY 購買兩日通票,立減999元;此外大會還推出了1024定製票,主會+分會自由組合,精彩隨心。


640?wx_fmt=jpeg


推薦閱讀

吳恩達說“將引領下一波機器學習技術”的遷移學習到底好在哪?

Google最強模型BERT出爐,NLP還有哪些值得期待的發展?

北京房租大漲?6個維度,數萬條資料幫你揭穿(附詳情程式碼)

那些一畢業就選擇華為的人,後來都怎麼樣了

宇宙第一 IDE Visual Studio 支援 Java 了!

為什麼比特幣是對政府最友好的加密貨幣?三大原因揭曉!

只因會區塊鏈,就被300個女孩瘋追?


點選閱讀原文,檢視大會更多詳情。2018 AI開發者大會——擺脫焦慮,擁抱技術前沿。