谷歌的数据集搜索于2018年9月首次发布,在正式测试版中,索引了近2500万个数据集。

数据集搜索可用于从科学研究到更多地了解您最喜欢的爱好的任何事情。

“在网络上,几乎任何你感兴趣的话题都有数百万个数据集。如果你想买一只小狗,你可以找到小狗买家投诉的汇编或者一个数据设置来自小狗认知研究。或者,如果您喜欢滑雪,您可以找到有关滑雪胜地收入或受伤率和出勤率的数据。”

Google 的新数据集搜索引擎来自 beta

自测试版发布以来,Google 新功能已根据从用户那里收集的反馈添加到数据集搜索中。现在可以根据所需数据集的类型(表格、图像、文本等)或数据集是否免费提供来过滤结果。

此外,数据集搜索现在可以在移动设备上使用,谷歌表示数据集描述的质量“显着提高”。

在数据集搜索中索引内容

发布者必须经历的过程才​​能使数据集搜索中包含的数据集保持完整。任何发布数据的人都可以使用适当的 schema.org 结构化数据来使他们的数据集可被发现。

请参阅:如何在 Google 数据集搜索中排名

迄今为止,使用数据集搜索的人员范围从学术研究人员到学生再到业务分析师。搜索最频繁的数据集包括“教育”、“天气”、“癌症”、“犯罪”、“足球”和“狗”。

数据集涵盖的最大主题包括地球科学、生物学和农业。最流行的数据集格式是表格格式,其中超过 600 万个包含在数据集搜索中。

虽然谷歌正式结束了测试版,但它仍然致力于改进数据集搜索,就像它一直在改进其主要搜索引擎一样。