<li id="mqce4"><dl id="mqce4"></dl></li><strike id="mqce4"><tr id="mqce4"></tr></strike><rt id="mqce4"><delect id="mqce4"></delect></rt>

<rt id="mqce4"><tr id="mqce4"></tr></rt>
  • 新聞動態

    谷歌學術搜索的風雨十年

    36氪/Chientung 2015-1-15 3:59:06

    在今年《自然》雜志開展的一項調查中,60% 的科學家表示自己經常使用該項服務。日前,《自然》雜志對話谷歌學術共同創始人 Anurag Acharya,聊了聊谷歌學術的過去和未來。

    問:你如何知道哪些文獻需要檢索?

    答:“學術”是學術領域的其他人都認為是學術的東西,這聽起來像是一個遞歸的定義,但確實是這樣的。我們通過爬蟲抓取所有網頁。以一篇新發表的博客為例,我們會判斷它和其他學術文章存在何種聯系。如果很多人引用它,或者它引用了很多人的文章,那么它可能具有學術價值。這里面并沒有神奇的公式可以套用,只能從很多特性中尋找證據。

    問:創建谷歌學術的想法從何而來?

    答:我在 2000 年來到谷歌,之前則在加州大學圣芭芭拉分校從事學術工作。很明顯,假如繼續從事學術研究,我不可能產生比待在谷歌更大的影響 -- 使世界各地的人們都可以找到信息。因此,我放棄了學術道路,花了 4 年時間管理谷歌網頁檢索團隊。那是一段異常忙碌的日子,整個人可以說是心力交瘁。

    Alex Verstak(注:Acharya 在網頁檢索團隊的同事) 和我決定休假半年,并試圖利用這段時間讓學術文章的搜索變得更加方便快捷。當時的想法并不是創建谷歌學術,而是想提高谷歌在用戶利用網頁搜索學術文章時的排名。不過,隨之而來的問題是如何判定搜索用戶的意圖:他們需要學術性的結果或者只是個門外漢? 我們據此建立了一個內部原型,谷歌學術變成了一種非常有用和重要的服務。

    問:這個想法很快就取得了成功嗎?

    答:很快就廣受歡迎。谷歌學術啟用后,使用量呈指數級增長。一個重要的差別在于我們按照與用戶請求的相關性排列搜索結果,這是此前的學術性搜索服務無法做到的。它們采用的是倒序方式,即首先提供最新的結果。我們還通過爬蟲抓取到研究論文的全部文本,盡管在一開始并未將所有出版商的全部文本包括進來。

    問:花了很多年才說服文獻出版社允許你們抓去全文,當時是不是感覺很困難?

    答:這得考慮到十年前的情況,那時候網絡搜索還很輕量 -- 人們更愿意搜索 Britney Spears 的圖片而不是學術文獻。但我們知道有純粹的學術搜索請求,我們不得不說服出版商,我們的服務會為他們帶來更多的流量。當然在谷歌學術搜索推出前我們就與他們有合作。

    問:2012年,谷歌學術從谷歌主頁搜索選項的下拉式菜單中消失。你是否擔心谷歌學術的地位可能下降或者被砍掉?

    答:不擔心。我們的團隊在不斷成長中,從成立之初的兩個人發展到現在的 9 人。很多人或許會將谷歌學術從首頁菜單中的撤銷看成是一種降級,但事實并非如此。這些菜單鏈接是為了幫助用戶從主頁轉到其他服務,因此會突出那些使用最多的轉換鏈接。如果用戶已經知道如何啟動谷歌學術,他們就不需要那種轉換鏈接。就是這樣而已。

    問:谷歌學術如何盈利?

    答:谷歌學術到目前還未盈利。其實,谷歌提供的很多服務都不賺錢。谷歌學術的首要定位是回饋學術界。我們之所以成功堅持到現在,就是因為在谷歌看來,這項服務的花費并不高。就訪問量來說,谷歌學術同很多谷歌服務相比很小,因此利用廣告盈利的機會相對較少。不過,到目前為止我們還沒有盈利上的壓力。

    問:谷歌學術每天的訪問量是多少?這項服務能追蹤多少文獻?

    答:我無法回答你,這是一個非常非常大的數字。對于追蹤文獻的數量也是這樣,除了 -- 自從我們推出谷歌學術后,這個數字增長了一個數量級。很多人關心這些數字,但這真沒多大必要。我們關注的是用戶能否找到他們想要的文獻。若果文獻本身很少的話,這些數字的確很重要,但我們顯然擁有足夠多的文獻。

    問:谷歌學術已經推出了額外的服務:例如作者的資料頁和一個推薦引擎。這意味著谷歌學術準備從一個搜索引擎轉向成為類似文獻計量學的工具嗎?

    答:既是,也不是。推出資料頁的目的還是在于幫助用戶找到他們需要的文獻。有時候你可能忘了文獻的標題,但你可能記得它的作者,這樣你就能找到相關文獻。你還能追蹤某個作者的文獻和工作,著同樣是查找文獻的線索。當然資料頁還有別的用途,通過閱讀一個人的資料頁,我們可以了解他的學術的演化歷程、他的學術伙伴們都有誰,甚至可以向他推薦一些他的領域中別的研究人員關注的主題。

    問:你擔心這種把戲嗎 -- 造假的文獻通過被谷歌學術檢索增加引用量?

    :不擔心。是的,你可以添加你想要的任何文件。但是,一切都是可見的 -- 你的資料頁上列出的文獻,引用你文獻的文獻等等。如果發現你造假,世界上的任何人都能打電話給你,基本上是你的學術生涯就結束了。我們沒有看到垃圾郵件正是由于這個原因。我有很多的經驗處理垃圾郵件,因為我曾經為搜索部門工作。當人們都是匿名的,垃圾郵件會變得更容易。但如果我要建立的是我的公開出版物的歷史,我會比較謹慎。

    問:未來谷歌學術會有什么樣的改變?

    答:我們非常擅長幫助用戶找到他們要搜索的文章。不過,下一步我們打算做的一件大事是幫助用戶找到他們需要但又不知如何搜索的文章。我們能否讓意外發現變得更加容易? 如何幫助每個人在無須翻閱上百篇論文導致一整天任何其他事都干不了的情況下,輕松掌握學術前沿?

    我不知道我們將如何實現這個目標。盡管在這方面我們已經做了一些初步努力如推出建議搜索引擎,但離想要的東西還相去甚遠。在向用戶推送不是其主動搜索的信息時,存在一個本質性問題:內容必須具有相關性,確保我們沒有浪費用戶時間,但又不能太相關,因為用戶已經知道這些文章。

    問:怎么幫助用戶直接找到數據而不是文獻呢?

    答:這是一個有趣的想法。在收費文獻里搜索數據是完全可行的。但當我們給用戶的搜索結果指向一個收費文獻時,用戶只能看到摘要。對全文檢索而言,我們也是依靠提供摘要信息讓用戶評估某篇文獻對他們是否有用。我們還沒有針對數據搜索建立類似文本搜索的模型。

    問:許多人希望能通過谷歌學術開放API,這樣他們可以自己寫搜索的腳本或自動獲取別人的資料頁,在此之上提供更多的服務。這可行嗎?

    答:我不能這么做。我們自己和出版商合作伙伴都不會喜歡這個想法。我們被允許掃描所有的文獻,而不是講這個信息分發出去。和出版商的合作非常重要,我們因此得以可以繼續構建一個對所有人免費的全面搜索服務。這是我們的初心,其他任何東西都是次要的。

    問:下一個十年你還會為谷歌學術工作嗎?

    答:首先我從來沒想到我竟然為谷歌學術忙活了十年!我妻子在我(為谷歌學術)工作了 5 年、7 年的時候提醒過我(工作了這么久),而我現在還沒離開。谷歌學術是我能想到我能做的最重要的事情,我們的工作使這個星球上最聰明的人更有效率。離開谷歌學術是一個非常有吸引力的命題,而我無法預見它會很快很輕松地實現。

    問:當你還是印度理工學院的學生時,你是否想過要是有這么一個免費、有效的搜索引擎該多好?

    答:(谷歌學術) 影響了我曾經關注的問題。舉例來說,當時沒有任何工具可以對只提供摘要的收費文獻進行全文檢索。我認為這是需要被解決的問題,因為對讀者來說,需要知道信息在哪兒。如果你知道一個關鍵的信息在一篇收費文獻里,你可以寫信給作者。但在這一點上,谷歌學術有它自己的生命。

    問:使用谷歌學術的用戶是否有必要擔心數據隱私問題?

    答:我們采用標準的谷歌數據收集政策,谷歌學術也不例外。我在谷歌的角色主要是負責谷歌學術,所以不會談太多更寬泛的問題。

    亚洲av中文无码乱人伦在线播放| 亚洲国产精品无码久久久久久曰| 日韩经典精品无码一区| 中文字幕欧美日韩在线不卡| 国产日韩精品无码区免费专区国产 | 久久国产精品无码HDAV| 中文字幕日本精品一区二区三区| a中文字幕1区| 波多野42部无码喷潮在线 | 亚洲精品无码mv在线观看网站| 亚洲AV中文无码乱人伦下载 | 亚洲中文字幕无码中文字在线| 精品无码人妻一区二区免费蜜桃| 国产品无码一区二区三区在线蜜桃| 熟妇人妻中文字幕无码老熟妇| 特级小箩利无码毛片| 国产精品无码av在线播放| 亚洲国产精品无码成人片久久| 免费a级毛片无码a∨免费软件| 最近中文字幕高清中文字幕无 | 最好看的中文字幕最经典的中文字幕视频 | 国产精品99久久久精品无码| 久久丝袜精品中文字幕| 波多野结衣中文在线| 无码人妻精品中文字幕免费 | 日韩电影免费在线观看中文字幕| 日韩A无码AV一区二区三区| 国产精品va在线观看无码| 久久久无码一区二区三区| 日韩亚洲AV无码一区二区不卡| 亚洲AV无码久久| 色偷偷一区二区无码视频| 亚洲AV无码专区国产乱码电影| 亚洲日产无码中文字幕| 八戒理论片午影院无码爱恋| 亚洲精品无码成人AAA片| 欧洲人妻丰满av无码久久不卡| 国产av永久无码天堂影院| 最近最新高清免费中文字幕| 熟妇女人妻丰满少妇中文字幕| 91中文字幕在线观看|