谷歌学术走过风雨十年 听创始人畅谈苦辣酸甜
资料来源:amitbsu
11月18日,免费的学术文件搜索引擎谷歌学术庆祝了它的10岁生日。谷歌学术通过使用网络爬虫抓取数百万篇学术论文,改变了研究人员在网上查找文件的方式。
在《自然》杂志今年进行的一项调查中,60%的科学家表示他们经常使用这项服务。几天前,《自然》杂志采访了谷歌学术的联合创始人阿努拉格·阿查里亚,谈论了谷歌学术的过去和未来。
问:你怎么知道哪些文件需要搜索?
答:我们通过爬虫抓取所有网页。以一个新发表的博客为例,我们将判断它与其他学术文章的关系。如果许多人引用它,或者如果它引用许多文章,那么它可能有学术价值。没有神奇的公式可以应用,只有证据可以从许多特征中找到。
问:创建谷歌学术的想法来自哪里?
答:我在2000年来到谷歌,在那之前,我在加州大学圣巴巴拉分校工作。显然,如果我继续从事学术研究,我不会比留在谷歌更有影响力,这样全世界的人都能找到信息。因此,我放弃了我的学术生涯,花了4年时间管理谷歌的网络搜索团队。这是非常忙碌的一天,整个人都筋疲力尽了。
亚历克斯·韦尔斯塔克(注:阿查里亚在网络搜索团队中的同事)和我决定休六个月的假,并试图利用这段时间让学术文章的搜索变得更容易和更快。当时的想法不是创造谷歌的学术,而是在用户使用网页搜索学术文章时提高谷歌的排名。然而,下面的问题是如何确定搜索用户的意图:他们需要学术成果还是只是外行?据此,我们建立了一个内部原型,谷歌学术已经成为一个非常有用和重要的服务。
问:这个想法会很快成功吗?
它很快就会流行起来。谷歌学术发布后,其使用率呈指数级增长。一个重要的区别是,我们根据搜索结果与用户请求的相关性对搜索结果进行排名,这在以前的学术搜索服务中是不可能的。他们使用逆序方法,即首先提供最新的结果。我们还通过爬虫抓取了研究论文的所有文本,尽管并非所有出版商的所有文本都包含在开始部分。
问:2012年,谷歌学术从谷歌主页搜索选项的下拉菜单中消失。你是否担心谷歌的学术地位会下降或被切断?
别担心。我们的团队从成立之初的两人发展到现在的九人。许多人可能认为谷歌学术从主页菜单中退出是一种降级,但事实并非如此。这些菜单链接旨在帮助用户从主页转到其他服务,从而突出显示最常用的转换链接。如果用户已经知道如何启动谷歌学术,他们不需要那种转换链接。仅此而已。
问:谷歌学术如何盈利?
答:谷歌学术还没有盈利。事实上,谷歌提供的许多服务都没有盈利。谷歌的学术重点是重返学术界。我们成功坚持到现在的原因是谷歌认为这项服务的成本并不高。就流量而言,与许多谷歌服务相比,谷歌的学术研究非常少,因此从广告中获利的机会相对较少。然而,到目前为止,我们对盈利能力没有压力。
问:谷歌的学术研究未来会有什么变化?
答:我们非常擅长帮助用户找到他们想搜索的文章。然而,我们计划做的下一件大事是帮助用户找到他们需要但不知道如何搜索的文章。我们能让偶然发现变得更容易吗?我们怎样才能帮助每个人轻松掌握学术前沿,而不必阅读数百篇论文,这使得我们不可能整天做其他事情?
我不知道我们将如何实现这个目标。虽然我们已经在这方面做了一些初步的努力,比如启动一个建议的搜索引擎,但我们离我们想要的还很远。当推送用户没有主动搜索的信息时,有一个基本问题:内容必须相关,以确保我们不会浪费用户的时间,但不要太相关,因为用户已经知道这些文章。
问:谷歌学术的用户有必要担心数据隐私吗?
答:我们采用标准的谷歌数据收集政策,谷歌学术也不例外。我在谷歌的角色主要是负责谷歌的学术研究,所以我不会谈论太多更广泛的问题。(燕杰)
中国科学新闻(2014-124,第三版国际)
上一篇:PubPeer网站创始人曝光