Google开源word2vec,文本相似度计算工具

谷歌已经使用Deep Learning技术开发了许多新方法来解析语言,目前,谷歌开源了一款基于Deep Learning的学习工具——word2vec,这是首款面向大众的Deep Learning学习工具。

word2vec(word to vector)顾名思义,这是一个将单词转换成向量形式的工具。通过转换,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。

word2vec为计算向量词提供了一种有效的连续词袋(bag-of-words)和skip-gram架构实现,word2vec遵循Apache License 2.0开源协议。[......]

阅读全文

后起之秀Facebook凭什么挑战互联网霸主Google?

尽管Google极其推崇开源,并推出大量的开源项目,但是从根本上来看,Google的开源力度、开放程度远远比不上Facebook。这也是为什么Facebook能够在短短的几年间,一跃成为全球最大的社交网站的原因之一。本文就来看看Facebook背后的开源力量。[......]

阅读全文

49 款人脸检测/识别的API、库和软件

自从Google Glass被推出以来,围绕人脸识别出现了很多争议。我们相信,不管是不是通过智能眼镜,人脸识别都将在人与人交往甚至人与物交互中开辟无数种可能性。

为了帮助研究过程中探索人脸识别,我们列出以下人脸检测和识别API。希望有所帮助![......]

阅读全文

MapReduce

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。他极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(化简)函数,用来保证所有映射的键值对中的每一个共享相同的键组。[......]

阅读全文

谷歌开源Gumbo:纯C语言实现的HTML5解析库

在探讨完Google背后的开源力量后,今天向大家介绍Google开源的一款用C语言实现的HTML5解析库Gumbo,作为一款纯C99库,Gumbo解析时无需任何外部依赖。它主要是用来成为其他工具或库的一个构建块,如linters、验证器、模板语言、重构和分析工具。[......]

阅读全文

Google背后的开源力量

《全球著名互联网企业背后的开源力量》文章中可知,目前开源软件已经成为了各大互联网企业背后的支撑力量,并逐渐改变着世界软件开发的格局。

[企业开源系列]系列专注于全球著名企业(包括国内企业)中的开源现状,探讨开源软件的力量,以使更多的开发者了解开源、贡献开源,打造更加和谐的国内开源生态。

本期先来了解Google背后的开源力量。
[......]

阅读全文

BLINK

网络应用

《BLINK》是由微软官方出品的一款拍照应用,你不会再错过任何一张好照片。BLINK会从你按下快门前开始拍摄一系列的照片。如果你太早或太晚按快门,别担心。有了BLINK,你只需在屏幕上轻滑就能找到最佳照片。你还可以返回BLINK找出某个镜头的第二张和第三张照片。微软研究院的高级照片稳定技术可以除去相机抖动带来的干扰,用户可以安心集中照重要的场景。[......]

阅读全文

link rel="canonical" 用法

权威链接Canonical

部分搜索引擎引入了Link的一个新属性Canonical。
复制内容或复制网页是指相同或十分相近的内容却有多个不同的URL,如打印页、含sessionid的URL等。现在可在副本网页的头部(head)加一个link标签,指定首选URL,声明一个权威网页做为复制网页的规范版本,SE将把链接等信息都转移到这个首选版本上,当然搜索结果中也显示权威网页。[......]

阅读全文

Google X项目:热气球作为WIFI热点

青藤科技6月20日报道,Google的“Project Loon”的项目是将热气球作为WIFI热点为地面提供上网服务,这个惊人的想法到底如何实现,其上网速度如何,下面我们一步步来为你揭开Google热气球之谜。

1、气球有多大

气球用用聚乙烯塑料制成,直径15米,整个设备高12米,用太阳能面板供电。[......]

阅读全文

sitemap

        Sitemap 可方便管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。[......]

阅读全文

GoAgent

GoAgent是google开发的一个基于Google Appengine的,全面兼容IE,FireFox,chrome的代理工具。

GoAgent是使用Python和Google App EngineSDK编写的免费代理软件。程序可以在MicrosoftWindows,Mac,Linux,Android,iPod Touch,iPhone,iPad,webOS,OpenWrt,Maemo上使用。GoAgent出口地址使用的是美国加利福尼亚州山景城Google数据中心IP段。[......]

阅读全文

谷歌将推出免费HTML5开发工具

据科技网站TechTrunch报道,谷歌将于数月后发布一款名为Google Web Designer的免费HTML5开发工具,让专业的创意人员更便捷地设计广告、网页内容和应用程序。

谷歌表示,Web Designer将是一款独立的产品,但是会被集成到富媒体工具DoubleClick Studio和广告工具AdMob中。谷歌目前的网页服务是Google Sites,通过Sites可以建设基本的网页和wikis预制模板,Web Designer中的网页设计功能让它有望取代目前Sites的地位。

Web Designer将同Squarespace、Weebly等HTML5开发工具直接展开竞争,与“原生广告”相结合的思路或许有助于它脱颖而出。

谷歌玩真的?披露Windows“零日漏洞”

谷歌上月底曾表示,在发现零日漏洞并告知相关开发商后,如果7天内还没有修复或告知用户防护措施,那么就支持发现漏洞者公布相关细节,以使用户自己想办法避免遭到攻击。

而近日,谷歌安全专家Tavis Ormandy在发现Windows中存在的一个提权漏洞,他并没有报告给微软,反而是在Full Disclosure邮件列表中公布了相关细节现在他又在同样的地方公布了利用漏洞的方式[......]

阅读全文

谷歌:“零日漏洞”7 天不修复就公布细节

谷歌安全工程师Chris Evans和Drew Hintz近日在官方博客中表示,如果发现一些软件中的零日漏洞(指厂商还未修复的未知漏洞)被广泛利用,而相关供应商在7日内还未修复或采取进一步行动,谷歌将披露这些漏洞的相关细节,让用户自己采取措施。
[......]

阅读全文

OTT

        OTT 是“Over The Top”的缩写,是通信行业非常流行的一个词汇,这个词汇来源于篮球等体育运动,是“过顶传球”之意,指的是球类运动员(player)在他们头之上来回传送而达到目的地。即互联网公司越过运营商,发展基于开放互联网的各种视频及数据服务业务,强调服务与物理网络的无关性。
        互联网企业利用运营商的宽带网络发展自己的业务,如国外的谷歌、苹果、Skype、Netflix,国内的Skype和QQ。Netflix网络视频[......]

阅读全文