Thursday, March 17, 2011

夹板气

咦,这里又能进来了。:) 这几天公司里突然发神经,要限制我们上网时间,把许多网站都封了。切。我在网上注册一些东西的时候,为了保护公司,用的是Gmail.Gmail 刚开始还没封,现在突然又进不去了,耽误事,可别怪我。

再说,不过是在这里打打工,你以为上班时间你就拥有我这个人了?大家都是热爱劳动的好民工,加班加点都是自觉自愿的,这么一来,我倒本能地想消极怠工。因为我被当成了劳务机器。

这是一头气。另一头,也受气。

去豆瓣在自己的贴下回个短贴,骂的其实是美国政府,结果大约是政府两个字敏感,结果还被检查,并且决定不能发出来。恶心了我半天。我本来不爱谈政治,说的不过是美国老百姓对教育的态度,真要叫政治辅导员看见了,还会高兴给他提供了批判美国制度的材料呢。弱智就弱智在这里。

可悲的是,聪明人的智力,用在这种弱智的、干预别人普通权利的肮脏勾当上,不知干这行的人究竟心中如何感觉?前几天还读到北京邮电大学校长的事迹,他的功劳就是发展了中国的网络长城,言谈举止之间还洋洋得意,因为他毕竟“击败”了很多竞争对手,产品被政府采纳,本人也功成名就,升官发财。

这样的产品,从本质上,让我想起奥本海默——他在领导制造了原子弹以后,到处游说,警告人们原子弹的危害。因为他还有道德,良心,知道自己创造出来的东西会危害人类。

昨天在豆瓣读一位女写手的文章。注意到她,首是因为她写的吃文,哇啦啦,口水直淌。这一篇不是说吃的,是说民间的色情文字的,说是色情,其实是情色,很风雅的,读起来稚朴俏皮可爱。只是读的时候发现很多小^,虽然不大,文字本身也流畅,没有受到这些^的影响,但毕竟密密麻麻遍布其中,令人纳罕。

作者自己坐了自己的沙发,说是加了这许多小眼睛,帖子才得以发出来。哑然苦笑。

突然就想起DragonNaturallySpeaking里面的tokenizer.这个产品的主要价值,除了Search Engine, 就是tokenizer了。搜集大量资料以后,用Tokenizer来将它们处理分类,然后再按出现频率和上下文录入字典,录音时,由Search Engine“猜”出最有可能的选择。

我估计,豆瓣的筛选器,也无非是将一些敏感词进行自动过滤,凡是有这些词出现的帖子一律扣住,缓发或禁发。而某同学的^,也无非是拆散了这个token,于是也就避免了被筛选的命运。

这么珍贵的人类智商,就这样白白耗费,实在是暴殄天物。

虽然大家都是混饭吃而已,一个发明Tokenizer这样可以让失去双臂的伤残人用语言向电脑中输入文字,和另一个专门设计软件来筛选芸芸众生闲时无聊的胡说八道,你说,你会选哪个。

No comments: