九章云极发布YLearn因果学习开源项目 助力人工智能迈向新阶段
日前,九章云极DataCanvas发布全新开源技术成果——YLearn因果学习开源项目。

官方资料显示,YLearn因果学习开源项目是一站式处理因果学习完整流程的开源算法工具包,能够解决因果学习中“因果发现、因果量识别、因果效应估计、反事实推断和策略学习”五大关键问题,具有一站式、新而全、用途广等特点,将“决策者”使用门槛降低,助力政府和企业自动化“决策”能力的有效提升。
据悉,YLearn因果学习开源项目是九章云极DataCanvas公司继DAT自动机器学习工具包、DingoDB实时交互式分析数据库之后,发布的第三款开源重器。此后,九章云极DataCanvas公司的开源基础软件版图进一步扩大,融合了AutoML和因果学习等前沿AI技术的开源基础工具系列将进一步加速数据智能在政府和全行业的价值释放。
通过结合前沿学术领域和市场应用领域的深度观察,九章云极DataCanvas开源项目研发团队发现,尽管目前广泛应用的基于机器学习得出的业务“预测”结果在提升业务收益方面的效果已经十分显著,但随着政府和企业对于“自主AI”和“智能决策”的需求日益旺盛,决策者需要一个让人可理解的、能够解释为什么做出一个决策的“原因”。 “因果关系”的呈现就此成为数据分析和智能决策的刚需功能,而只提供数据“相关性”的机器学习则无法做到这一点。
YLearn因果学习开源项目(以下简称“YLearn”)具备九章云极DataCanvas产品“开源、灵活、自动”的基因。立足于开源社区,YLearn旨在填补市场上缺少完整、综合性、端到端因果学习工具包的空白,与全球的开源贡献者共同打造一个端到端、完整、系统的因果学习算法工具包,从工具端直接降低“决策者”的使用成本。
目前,YLearn由CausalDiscovery、CausalModel、EstimatorModel、Policy、Interpreter等部件组成,各部件支持独立使用,也支持统一封装。通过这些灵活的组件,YLearn实现了用因果图表示数据集中的因果关系、识别因果效应、概率表达式和各类估计模型等功能,并将紧跟前沿研究持续添加和完善性能。
为了进一步降低使用门槛,除了让使用流程清晰简单、易于上手,YLearn还将融合九章云极DataCanvas公司核心技术——AutoML自动机器学习。通过AutoML技术的加持,YLearn将实现自动调参、自动优化、一键自动生成对应结果“Y”的多种决策方案等“自动化”高级功能;此外,YLearn还将实现基于因果关系的可视化决策图谱,例如设定企业运营的运营指标,通过交互式的方式来推演不同决策带来的影响和效益。
因果学习的潜力和对未来人工智能技术走向的影响力,已经受到学术界和产业界认可。2011年图灵奖得主,贝叶斯网络之父Judea Pearl曾提到,“如果没有对因果关系的推理能力,AI的发展将从根本上受到限制”。
清华大学计算机系长聘副教授、博士生导师崔鹏指出,“因果统计将在新一代人工智能理论基础层面扮演重要角色”。当前人工智能局限性的根源是“知其然,但不知其所以然”。其中,“知其然”中的“然”指的是数据之间的“关联”关系,“所以然”指的是数据之间的“因果”关系。通过把因果统计引入到机器学习中的多年研究,崔教授团队发现因果统计在解决机器学习的稳定性问题、解释性问题、算法的公平性问题等均有突出的表现。
商业市场上同样呼吁应当加快因果学习技术的产业化应用。在Gartner最新发布的因果学习创新洞察报告《Innovation Insight:Causal AI》中指出, “人工智能必须超越基于相关性的预测,朝向基于因果关系的解决方案,以实现更好的决策和更大的自动化。……因果人工智能对未来至关重要。”
因果学习技术将大力提升人工智能技术的自主性、可解释性、适应性和鲁棒性。这些特性对于基于AI技术实现数智化升级的政府和企业来说,将进一步降本增效,并收获超预期的数据价值。
一项前沿技术能够在商业市场中实现成功的规模化应用,离不开功能强大的开源工具的助推和催化。YLearn因果学习开源工具包的出现解决了市场上缺失功能强大且完整的因果学习工具包这一难题,加速将因果学习技术从“实验室”带入“产业应用”。