打工e族

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 90|回复: 0

法官必须认识到谷歌影​​响搜索结果

[复制链接]

1

主题

1

帖子

5

积分

初入职场

Rank: 1

积分
5
发表于 2024-1-14 19:00:44 | 显示全部楼层 |阅读模式

上周,主持人 Xuxa Meneghel 与搜索提供商 Google 之间的案件再次曝光[ 1 ]。争论似乎再次仅限于所谓的“被遗忘权”。然而,当辩论仅限于这个主题时,非常重要的问题就被抛在了后面。

泰斯·加斯帕里安 (Taís Gasparian) 强调,“被遗忘权”一词汇集了相当多样化的讨论,涵盖了对“(i) 媒体机构(包括新闻机构和互联网网站)删除被认为不适当、不相关或不恰当的已发布内容的请求”。不再与特定人员和 (ii) 所谓的“搜索者”、去索引信息相关”[ 2 ]。在本文中,我们将讨论第二个方面,也称为“去索引权”。

对 Xuxa 案以及其他几起有关搜索结果去索引的讨论的判决的分析表明,巴西法院(包括高等法院)大多数人都认为 Google 是中立的[ 3 ],被动中介,其活动只是在互联网上收集信息并将其传输给用户,而不干预这一过程。在最近的一项特别呼吁 1,593,873-SP 中做出的决定中,Nancy Andrighi 支持这一立场:

此外,搜索引擎呈现的结果只不过是其他网站或互联网资源,它们是公开可用的,即独立于搜索提供商。这些网站或资源不断、不间断地更新。

即使存在多种过滤互联网内容的机制,大多数时候搜索提供商也不可能对搜索结果进行任何形式的控制。这是因为定义授权否决或丢弃给定页面的标准是有问题的。

然而,这种关于谷歌中立和被动的说法并不成立。当安德里吉说搜索提 中国海外英国号码数据 的控制不可行时,他没有注意到它已经自动完成了;也就是说,尽管没有谷歌员工负责为世界上进行的每次搜索选择结果,但有为此目的开发的程序甚至可以确定某些信息是否应该出现在搜索的第一页、第二页或第十页上引擎。这些程序并非自然产生或通过魔法产生,而是源自人类在创造和改进时做出的选择。考虑到用户倾向于仅访问首页上存在的链接,此选择对将访问的内容具有根本性影响。

正如谷歌自己所认识到的那样,其活动分为三个部分:抓取、索引和发布结果。简而言之,第一个活动是由机器人执行的,它们检测新链接,识别网站内容的变化,从而更新索引。在索引阶段,对找到的页面和内容进行编译和组织,识别找到的单词及其在文本中的位置。根据谷歌给出的解释,“我们处理主要属性和内容标签中包含的信息,例如标题标签和替代属性”[ 4 ]。根据搜索提供商本身在其参与的法律程序中提出的描述,这种机制“或多或少像一本书的索引一样。Googlebot带来的所有信息都被分离并组织到索引器中的某个类别中”[ 5 ]。

最后,最后一个阶段是搜索处理,它涉及用户界面(搜索框)和引擎,这是一种评估搜索和组合文档的机制。根据用户提供的关键字,提供商的机器在上述索引中执行搜索,然后呈现被认为最适合所执行的搜索的结果。然而,结果的“排名”并不是随机的。因此,根据谷歌自己给出的解释:



相关性由 200 多个因素决定,其中包括给定页面的PageRank 。PageRank是基于其他页面的入站链接来衡量页面重要性的指标。换句话说,从另一个网站到您网站上的页面的每个链接都会为您的网站添加一个PageRank。并非所有链接都是一样的:Google 通过识别垃圾链接和其他对搜索结果产生负面影响的做法来努力改善用户体验。最好的链接类型是根据内容质量返回的链接[ 6 ]。

换句话说,有几个标准可以指导结果;他们都是谷歌选择的。其中之一称为PageRank,是 Google 搜索引擎用来选择给定搜索结果顺序的算法。该过程已获得美国斯坦福大学的专利,但搜索提供商有权许可其使用。




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|打工e族 ( 鲁ICP备2021044221号 )

GMT+8, 2024-11-24 11:50 , Processed in 0.063293 second(s), 19 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表