来源:课程图谱博客
本文约2300字,建议阅读9分钟
本文带你了解编程界称霸全球的十大算法。
算法究竟是什么?
简而言之,算法代表经过明确定义的计算过程,用于将输入转化为输出。
可以这样理解,算法是用来解决特定问题的一系列步骤(不仅计算机需要算法,我们在日常生活中也在使用算法)。就目前来看,具有以下三大特征的算法才具备实际效果:
此外,需要强调的是,算法的应用不仅局限于计算机科学,同时它也作为一种数学实体。早在公元前1600年,巴比伦人就发现了用于求因式分解和平方根的算法。如果将算法视作数学实体,那么称霸世界的十大算法极可能为算术方法(如加、减、乘、除等)。
如果按照本文中算法的定义,称霸世界的十种算法究竟有哪些呢?在这里,我列出了一份小小的清单,排名不分先后。
合并排序、快速排序与堆排序
哪个排序算法效率最高?这要分情况讨论。因此我将这3种算法放在一起来讲,可能你更常用其中一种,但事实上三者都很重要。
合并算法是迄今为止我们所拥有的最重要的算法之一,是分治法的一个典型应用,由数学家John von Neumann于1945年发明。
快速排序算法,结合了集合划分算法和分治算法,虽该算法并不是很稳定,但在对基于内存的数组进行排序时表现非常出色。
最后是堆排序,其采用优先伫列机制,减少排序时的搜索时间,同样不是很稳定。
但这些算法相较于之前的冒泡排序等,有了很大的改进。也多亏了这些算法,才有今天的数据发掘,人工智能,链接分析,以及大部分网页计算工具。
傅利叶变换与快速傅利叶变换
这两种算法简单,但却相当强大,整个数字世界都离不开它们,其功能是实现时间域函数与频率域函数之间的相互转化。能看到这篇文章,也是托这些算法的福。
因特网,WIFI,智能机,座机,电脑,路由器,卫星等几乎所有与计算机相关的设备都或多或少与它们有关。不会这两种算法,你根本不可能拿到电子,计算机或者通信工程学位。
迪杰斯特拉算法 (Dijkstra’s algorithm)
可以这样说,如果没有这种算法,因特网肯定没有现在的高效率。只要能以“图”模型表示的问题,都能用这个算法找到“图”中两个节点间的最短距离。
虽然如今有很多更好的方法来解决最短路径问题,但代克思托演算法的稳定性仍无法取代。
RSA非对称加密算法
如果没有这个算法对密钥学和网络安全的贡献,如今因特网的地位可能就不会如此之高。现在的网络毫无安全感,但遇到钱相关的问题时我们必须要保证有足够的安全感,如果你觉得网络不安全,肯定不会傻乎乎地在网页上输入自己的银行卡信息。
RSA算法,密钥学领域最厉害的算法之一,由RSA公司的三位创始人提出,奠定了当今的密钥研究领域。用这个算法解决的问题简单又复杂:保证安全的情况下,如何在独立平台和用户之间分享密钥。
哈希安全算法(Secure Hash Algorithm)
确切地说,这不是一种算法,而是一组加密哈希函数,由美国国家标准技术研究所首先提出。无论是你的应用商店,电子邮件和杀毒软件,还是浏览器等等,都使用这种算法来保证你正常下载,以及是否被“中间人攻击”,或者“网络钓鱼”。
整数质因子分解算法(Integer factorization)
这其实是一个数学算法,不过已经广泛应用于计算机领域。如果没有这个算法,密码学技术的安全水平将受到严重破坏。该算法用于将复合数的质数因子分解到较小的非零因数。也被称为FNP类问题,属于NP类问题的拓展,且解决难度极高。
很多加密协议都采用了这个算法,就比如刚提到的RSA算法。
链接分析算法(Link Analysis)
在互联网时代,不同入口间关系的分析至关重要。从搜索引擎和社交网站,到市场分析工具,都在不遗余力地寻找因特网的正真构造。
链接分析算法一直是这个领域最让人费解的算法之一,实现方式不一,而且其本身的特性让每个实现方式的算法发生异化,不过基本原理却很相似。
链接分析算法的机制其实很简单:你可以用矩阵表示一幅“图“,形成本征值问题。本征值问题可以帮助你分析这个“图”的结构,以及每个节点的权重。这个算法于1976年由Gabriel Pinski和Francis Narin提出。
谁会用这个算法呢?Google的网页排名,Facebook向你发送信息流时(所以信息流不是算法,而是算法的结果),Google+和Facebook的好友推荐功能,LinkedIn的工作推荐,Youtube的视频推荐,等等。虽然其各自拥有不同的目标与参数组合,但背后的数学原理却是相通的。
最后,我想说一点,很多人普遍认为Google是首先使用这类算法的机构,不过其实早在1996年(Google 问世2年前)李彦宏就创建的“RankDex”小型搜索引擎就使用了这个思路。而Hyper Search搜索算法建立者马西莫·马奇奥里也曾使用过类似的算法。这两个人都后来都成为了Google历史上的传奇人物。
比例微积分算法
飞机,汽车,电视,手机,卫星,工厂和机器人等等事物中都有这个算法的身影。
简单来讲,这个算法主要是通过“控制回路反馈机制”,减小预设输出信号与真实输出信号间的误差。只要需要信号处理,或电子系统来控制自动化机械,液压和加热系统,都需要用到这个算个法。没有它,就没有现代文明。
数据压缩算法
数据压缩算法有很多种,哪种最好?这要取决于应用方向,压缩mp3,JPEG和MPEG-2文件都不一样。
哪里能见到它们?不仅仅是文件夹中的压缩文件。你正在看的这个网页就是使用数据压缩算法将信息下载到你的电脑上。除文字外,游戏,视频,音乐,数据储存,云计算等等都是。它让各种系统更轻松,效率更高。
随机数生成算法
到如今,计算机还没有办法生成“真正的”随机数,但伪随机数生成算法就足够了。这些算法在许多领域都有应用,如网络连接,加密技术,安全哈希算法,网络游戏,人工智能,以及问题分析中的条件初始化。
总结
总的来说,计算机的发展放到应用和数据飞速增长的大环境下,我们会发现:算法的重要性不是在日益减小,而是在日益加强。
本文链接地址:
http://blog.coursegraph.com/统计学公开课大盘点
编辑:于腾凯
—完—
关注清华-青岛数据科学研究院官方微信公众平台“ THU数据派 ”及姊妹号“ 数据派THU ”获取更多讲座福利及优质内容。