英文:Emil Wallner,编译:伯乐在线 - MentosZ
如有好文章投稿,请点击 → 这里了解详情
从代码中追溯深度学习的历史
[......]
[......]
来源:cywosp
链接:http://blog.csdn.net/cywosp/article/details/23397179/
一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似。一致性哈希修正了CARP使用的简 单哈希算法带来的问题,使得分布式哈希(DHT)可以在P2P环境中真正得到应用。[......]
[......]
来源:伯乐在线专栏作者 - hoohack
链接:http://blog.jobbole.com/101792/
[......]
自从相关工具创建以来,我们一直通过对海量的随机数据执行排序来测试MapReduce。这种方式很受欢迎,因为生成任意数量的数据非常简单,想要验证输出结果是否正确也很简单。[......]
MIT计算机科学和人工智能实验室与哈佛的研究人员开发了名为Polaris的 算法,能减少34%总页面加载时间。当我们访问一个网站,首先是在浏览器地址栏输入域名,DNS服务器将域名转换成托管网站的服务器IP地址,然后浏览器 会下载网站的索引文件,一个HTML页面。在HTML页面内,网站源代码会加载以CSS和JS文件、图像、Flash等形式的不同资源,每个资源都有独立 的网络请求,建立网络请求所需的时间是导致网页加载缓慢的主要原因。为了解决这个问题,Polaris框架为每个页面绘制一个依[......]
对于现在流行的深度学习,保持学习精神是必要的——程序员尤其是架构师永远都要对核心技术和关键算法保持关注和敏感,必要时要动手写一写掌握下来,先不用关心什么时候用到——用不用是政治问题,会不会写是技术问题,就像军人不关心打不打的问题,而要关心如何打赢的问题。[......]
话说写一个抽奖程序还不容易,不就是生成一个随机数吗,哪需什么算法之类的。
从技术上说,这确实不难。事实上,你怎么写都可以,因为程序只运行在特定的设备上,外人根本无法了解其中的细节。
那么问题就来了,如何才能让大家相信你没有作弊?[......]
英文出处:yahoo labs
译文来自:伯乐在线
【导读】:数据是机器学习研究的命门。访问真正的大规模数据集,是一项传统上由机器学习研究者和大公司的数据科学家所保有的特权,然而大多数学术研究人员缺无法触及。2016年1月14日,雅虎实验室对外发布了发布史上最大机器学习数据集,达 13.5 TB。[......]
VMware CEO Pat Gelsinger曾说:
数据科学是未来,大数据分析则是打开未来之门的钥匙
企业正在迅速用新技术武装自己以便从大数据项目中获益。各行业对大数据分析人才的需求也迫使我们升级自己的技能以便寻找更好的职业发展。
跳槽之前最好先搞清楚一个岗位会接触到的项目类型,这样你才能掌握所有需要的技能,工作的效率也会更高。
下面我们尽量列出了一些流行的开源大数据项目。根据它们各自的授权协议,你或许可以在个人或者商业项目中使用这些项目的源代码。写作本文的目的也就是为大家介绍一些解决大数据相关问题可能会用到的工具。[......]
发 送报文时,发送方由报文文本计算生成报文摘要,然后用自己的私钥对这个摘要进行加密,这个加密后的摘要将作为报文的数字签名和报文一起发送给接收方。接收 到报文之后,接收方使用发送方的公钥对报文附加的数字签名进行解密,然后由接收到的原始报文计算出报文摘要,如果两个摘要相同,那么接收方就能确定该数字 签名是发送方的。[......]
Pinterest首页的Feed消息流,最早是按照用户的关注对象的Pin(Pin类似微博)聚合后按时间进行排序(自然序,类似朋友圈),后来版本的 feed系统放弃了自然序,而是根据一定规则及算法来设计,内部称之为Smart feed,其算法及架构根据其公开资料整理如下,值得业界做信息流产品的技术架构师参考。[......]
算法一:快速排序算法
快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。
快速排序使用分治法(Divide and conquer)策略来把一个串行(list)分为两个子串行(sub-lists)。 [......]
[......]