教霍金天文 发表于 2009-6-25 12:48

[转]为什么谷歌这么容易搜出淫秽信息

【下列文字出现纯属肌肉抽搐不能自主敲击键盘所致,谢绝跨虫洞追捕】
【以下为转载正文】
最近google的事大家都知道,
CCTV上播放的视频是,当你搜索“儿子”,google的自动联想显示出很多淫秽的信息。
当时我就有点纳闷,据我了解,这个ajax的搜索框所产生的联想应该是采用了类似LRU算法一类的技术,即优先显示最近最多用户的搜索结果。也就是说,被联想到的词光热门没用,还必须要“近期很热门”才行。
我就纳闷了,难道诸如“儿子母亲不正当关系”这样的词条难道会长期被大量搜索吗?直到今天我看到下面这篇技术分析,我才恍然大悟。
以下内容大家看完,应该能够心领神会,不用我多说吧。
某些东西真的以为我们是弱智?从这种技术水平看来,他们比他们心目中的我们还要弱智。
【前情】
6月18日央视《焦点访谈》
记者:通过谷歌中国能搜索出来的淫秽色情和低俗信息非常的丰富,不仅有交友、视频、还有文字等等,而且搜索起来非常方便,它还提供了这么一种功能,你只要输入一个词,甚至是一个字它就能给你提供若干种选项,更为夸张的是,即使你输入的这个词并不暧昧,但是它却能给你引导到低俗的内容上,不信我们来看一下:输入一个儿子,它下面却出现了这样的一些选项“儿子母亲不正当关系”等等十个选项,而且这十个选项可以说都将引导你进入到那些低俗的内容,这样的结果应该说我们谁都没有想到。
参考用“谷歌搜索低俗引导”
http://upfile.cat898.com/UploadFile/2009-6/2009625103053316.jpg
Google的搜索引导词是根据近期搜索频率来分的,也就是说,引导词里会出现最近一段时间内搜索的次数较多的组合。Google Trends上就能查到流量比较大的情况下的搜索频率走势。
而更为先进的Google Insights for Search(http://www.google.com/insights/search/)里则详细地记录下了2004年至今各搜索组合的次数涨落,并且还可细分网页搜索、图片搜索、新闻搜索,和按不同国家与地域、不同时间段来进行检索。
请看图说话。
http://upfile.cat898.com/UploadFile/2009-6/2009625103258726.jpg
图一,关键字“儿子与情人”在6月10日以后的搜索地区分布图
http://upfile.cat898.com/UploadFile/2009-6/2009625103346797.jpg
图二,关键字“儿子母亲不正当关系”在6月10日以后的搜索地区分布图
http://upfile.cat898.com/UploadFile/2009-6/2009625103547164.jpg
图三,6月10日至6月17日的关键字搜索增长率分析
http://upfile.cat898.com/UploadFile/2009-6/2009625103631620.jpg
图四,5月19日至6月17日的关键字搜索增长率分析
解读:
在这几张“30天内统计数量”的表里我们可以看到,从6月10日起,“儿子与情人”和“儿子母亲不正当关系”两种搜索组合的搜索率直线上升,而之前的搜索量则几乎可以忽略不计。并且这些搜索近100%都是由北京的用户完成的。而且这些词条总共也就被搜索了十几二十来次。
同样,在搜索频率上升排行中我们也可以得到印证,这两个条目在过去从来没有这么“火热”过。
巧合?
同样是6月10日,同样是北京用户。同样是20次上下的搜索次数。
巧合?
真的是巧合吗?
http://upfile.cat898.com/UploadFile/2009-6/2009625103811793.jpg

雨夜狼星 发表于 2009-6-25 13:03

鬼才知道,很少用谷歌,新闻报了才知道

skyczheng 发表于 2009-6-25 13:18

我从来不用谷歌,我只用百度!

littlePig 发表于 2009-6-25 13:26

我也一直认为Google 上的联想推荐是根据用户搜索频度来调整的。

neveruse 发表于 2009-6-25 13:31

早就说过了,这事背后有阴谋,哪是某些人一直鼓吹的的“网络自由”那么简单。

百度的粉丝请看这个
http://ezerg.bokee.com/3224886.html
百度的搜索引擎说实话还是不错的,但是百度这公司的劣迹太多了。

pana_cn 发表于 2009-6-25 13:44

GM不可信
yct36.gif

skyczheng 发表于 2009-6-25 14:02

我试过,我个人认为百度适合国人实用(个人观点)!

zhangyf1997 发表于 2009-6-25 14:08

看来北京人的素质也高不到哪里去。

ForeVeR' 发表于 2009-6-25 14:08

直白告诉你,为了增加点击率,就是这样

pana_cn 发表于 2009-6-25 14:10

google专业性比较强吧
有些东西baidu搜不到

gohomeman1 发表于 2009-6-25 14:35

楼主的话我看懂了,潜台词很明白。你的怀疑我认为很合理。说实话,我以前从来没有搜索过“儿子”这个词,简单被骗了。

不过,这样的做法,貌似太低级了,怎么还当我们是60年代的人呢。虽然前几天和neveruse对垒,这次我认为他说得有理。

neveruse 发表于 2009-6-25 15:02

11# gohomeman1
谢谢理解,我对您为论坛做的事还是很敬佩的

shiaki 发表于 2009-6-25 16:11

欲加之罪何患无词啊…

火星羊儿 发表于 2009-6-25 16:54

明白楼主的意思了

尽管谷歌上了央视新闻,我仍然在用谷歌,其他的不理

meteorobs 发表于 2009-6-25 18:25

用数据说话,看Google 怎样被陷害

http://blog.sina.com.cn/s/blog_60676a3f0100e0xk.html

这篇文章上午刚发布,下午就被河蟹了。。。

poweru235 发表于 2009-6-25 18:41

国内事百度 国外事谷歌 图片也是谷歌百度就没有大于3000x3000的图 可悲

今天看到一篇文章 那哥们搜的体育宝贝 一个漏点的没有 我用百度搜 也大概就是那些。。。

底下赫然有个oooooooooooooooleNext 字样.....

妈的用com搜索上来当cn真是可恶
页: [1]
查看完整版本: [转]为什么谷歌这么容易搜出淫秽信息