我们在这个领域的研究目标是针对不断出现的复杂计算任务,特别是那些统计计算应用,进行算法的并行优化以提高其可扩展性,并进行计算机架构上的性能分析。具体体现在:
-
对机器学习的最新应用并行化,以推动未来英特尔架构设计,最终实现计算机的自动识别、信息挖掘与合成。
-
与国内优秀大学和研究机构合作,共同进行并行计算与机器学习算法的研究。
在过去的几年间,我们进行了自然语言处理,信息挖掘,语音识别,视频跟踪以及生物信息学等领域的算法和应用研究,并与美国总部的英特尔系统研究实验室、英特尔俄罗斯研究中心以及Kevin Murphy博士合作开发了概率网络库(PNL), 我们实现了其中的结构学习算法。PNL实现了基于图模型(Graphical Model)的构造、推理和学习,可以广泛用于人工智能与模式识别的多种领域。一些基本的算法,如Junction Tree 推理算法,EM学习算法,图模型的结构学习算法等,都已实现了良好的优化和并行,并已应用于生物信息学研究,包括单核苷酸多态性(SNPs)、蛋白质三维结构预测以及蛋白质同源性搜索,致病基因发现等领域。我们也正在对其它的一些有广泛应用价值的算法,如机器学习算法,优化算法等等进行深入研究。在应用研究方面,我们将把这些算法推广到其他新领域,如数据/文本挖掘等, 最终实现计算机的自动识别、信息挖掘与合成的远景。
与此同时,我们着重于算法并行化与性能评测的工作。借助于处理器内建硬件性能记数器及操作系统内建软件性能记数器, 详细地观察与记录程序的运行行为. 在此基础上对程序进行广泛的优化, 使算法达到良好的硬件/软件/网络资源使用率. 同时将程序的行为与其它通用基准程序, 如 SPEC, NPB, 进行比较, 将结果反馈给英特尔架构研究员与产品部门, 协助制定未来处理器开发策略. 我们还致力于对各类机器学习算法的并行性与可扩展性进行定量的评估和预测, 在此基础上我们已对一些有广泛应用价值的算法(如贝叶斯模型的结构学习算法)实现了广泛的并行, 在SMP机群上的加速比达到国际先进水平。我们正在对更多的重要算法进行并行化与性能评测研究,如模拟退火等。