星空体育(中国)官方网站-XK SPORTS

欢迎您访问 广东电缆桥架有限公司官方网站

XK体育简介 联系XK体育 网站地图

欢迎来电咨询

13988888888

XK体育新闻资讯

全国服务热线

13988888888

技术过硬,据实报价

明略科学院院长、IEEE Fellow吴信东:大数据知识医疗器械企业工程基础理论 直播课笔记

2024-06-01 18:18 已有人浏览 小编

  不久前,明略数据成立明略科学院,并由明略科学院院长吴信东教授带来第一讲:《大数据知识工程基础理论及其应用》相关分享。

  吴信东教授是国家“千人计划”特聘专家,长江学者,IEEE & AAAS Fellow,数据挖掘研究与应用领域的顶级科学家。

  在分享中吴信东教授讲解了新环境下大数据技术应用研究成果,与大家共同探讨了大数据的科学难题及解决方法,分享了科技部大知识的研究方案。

  从大数据来凝练大知识,是华人学者启动的一个台阶,2016年我牵头,联合国内15家单位在科技部开始做一个重点研发计划的专项项目,叫大数据知识工程。我是这个项目的首席科学家,包括合肥工业大学、中科院与系统科学研究院,西安交通大学、中国科技大学、华东师范大学,还有百度和杭州的丁香园等。

  我自己以前是做专家系统的,学过人工智能的人可能都知道,专家系统是人工智能的一个应用分支,是知识工程的一个应用实践。我的早期学术历程包括:

  • 1988年,北京的电子工业出版社《专家系统技术》;• 1990年,中国科技大学出版社,《专家系统设计》;• 1991年,到了英国爱丁堡大学人工智能系读博士;• 博士读完后,在美国出了第一本英文专著,叫《Knowledge Acquisition from Databases》,1995年出版。

  互联网到物联网时代的核心是物物相连,从原来单纯的World Wide Web,到把Web上面的所有可能的信息都搜集起来,包括传感器,相关的人、物所提供的一相关信息资源等。互联网时代的物物相连正在悄悄地走向人工智能和机器人的时代,医疗器械企业也就是智能信息处理,被称之为人类第四次工业革命。

  1956年的达特茅斯会议标志着“人工智能”这个概念的形成。在1956年以前,在世界各地,包括美国、英国,大家都做一些尝试,机器翻译、智能语言处理、图灵机的设计、早期的神经网络的设计。1956年标志“人工智能”的诞生,其中的核心问题,是制造更聪明的计算机。随着人工智能概念形成以后,涉及到不同的侧面的探索,早期以搜索式推理、符号逻辑为驱动的。

  真正让人工智能走向社会、走向世界、走向各行各业的应用,还是80年代的专家系统。

  我个人的研究背景涉及到专家系统和知识工程。其后大家又认识到光靠专家系统和符号推理,人工智能应用还是有明显局限。

  90年代以后,摩尔定律和统计学习推动了人工智能的广泛应用,近期的深度学习也挺火热。深度学习给人工智能掀起了一个高潮,当然也涉及到机器学习的其他方法。到了当今时代,大数据以及计算的需求揉和到人工智能系统开发里了。

  我现在的研究主题是知识工程。在国际上,专家系统和知识工程的一个代表性人物,是斯坦福大学的Edward Feigenbaum。Feigenbaum教授1994年拿到了计算机学科的最高奖图灵奖,在好多的文献里面Feigenbaum教授就被称为专家系统之父,也就是知识工程之父。

  Feigenbaum把专家系统和知识工程定义为对应用问题求解所进行的知识的获取、表达和推理。专家系统这门课包含三项核心技术:

  第一、知识获取,就是怎么去跟专家打交道,把专家的知识获取来放到计算机程序里面去,知识获取就涉及到自动的、半自动的,还有人工的。

  第二、医疗器械企业获取了知识以后,首先要进行形式化,也就是逻辑表示、语义网络表示,还有状态空间图表示和产生式系统,这是四种典型的知识表示方法。

  第三、知识表示成形式化的描述,进到专家系统后,就要进行问题求解,涉及到知识推理,包含正向推理、反向推理、双向推理。知识工程指的就是知识的获取、表示和推理,这是在国外。

  在国内,我们中国科学院数学与系统科学研究院的陆汝钤院士,是国内做专家系统、知识工程的先行者。陆院士在最近《大数据在各领域的应用及发展策略》报告里面,把专家系统和知识工程分成了四代。这里暂不赘述,如果有兴趣可以自行搜索学习。陆院士亲自领导国内知识工程开发工作。

  第一、知识的获取。如果专家提供的知识不可靠,或者我们没有办法把专家知识获取后形式化地放到计算机程序里面去,那么系统就不可能成为专家系统。

  第二、知识再工程。开发一个专家系统的时候,可能要从0开始学,知识的获取过程、形式化的手段,还有建计算机程序知识库的过程,再工程指的是知识构建过程的工程话重复使用。

  大数据的一些典型特征,大家可能听到的最多的都是五V模型,叫Volume、Variety 、Velocity、Veracity、Value,就是从数据的规模、多样性、变化尺度、数据质量的可靠性,定义大数据。

  我自己还有合肥工业大学团队也凝练了一套大数据的特征,称为HACE定理。HACE定理的文章现在已经被引用1600多次了。HACE定理是四个字母:

  第一个特点叫群智性。就是指依靠User Generated Conent,所以叫UGC。可依靠人人参与所提供的海量的、低质的碎片化的知识来进行问题修建,没有一个完整的结构,或者说没有一个完整的本体,因此我们要学。

  在学的过程中间就遇到了第二个特点,知识库要具备自完备和增殖能力。要用到知识的关联、知识的推理,需要推导一些暂时在知识库里面还找不到的知识。

  大数据环境下,异构、自治、复杂、医疗器械企业演化,问题求解就需要对用户来进行充分地交付,来学习用户的问题以及用户的痛点究竟在什么地方。

  大数据的知识工程或者说大知识是建立在大数据基础上的层次拔高。大数据知识工程是在问题求解的基础上,把知识进行凝练、抽取,做进一步的融合。目的是在大数据求解过程中,知识能够帮助其他问题求解,或帮助其他领域人员实现知识加宽。我们要在大数据环境下,形成大数据知识工程的先发优势,这符合国家战略目标。

  从这个角度上来讲,知识工作的自动化对未来的经济社会能起到一种颠覆性作用,以前我们都做数据分析,我们现在做知识凝练、知识处理医疗器械企业。应用范围比较多,普适医疗、远程教育、安全预警、旅游、商业智能,我们这15家单位现在都涉及到这几个方面。

  大数据知识工程是国家科技部的项目,目标是要建立国家的知识平台,来提供精准的高水平的知识服务。我们要面向不同的用户来做精准服务,所以研究技术专家要面临不同的应用领域,面临不同的服务方式。

  下面介绍以公安大数据为例,大数据知识工程、大数据服务在商业公司里面的实际体现。

  明略公司是一个行业人工智能公司。我们现在做的三个主要行业,安防、金融、工业轨交, 同时,三个行业里面我们现在做的规模最大、影响最大的,还是公安数据。公安数据和其它行业应用一样,底层还是做知识图谱,开发了一套系统,也积累了很多数据和知识体系,无论哪个行业的基本原理是一致的,都是从很多的基础数据里面找关联医疗器械企业,找主题信息,再去凝练特征,通过建模型来进一步凝练特征,最终建成一个人工大脑,或者叫智能系统。

  有了智能系统,就是实现认知智能的基础,最前面有很多单独的数据源,后面做关联,然后凝炼成特征,在建模之前大家可以看到,用一个形象化描述知识图谱,正如火眼金睛可以识别关联关系。知识图谱是明略数据做行业人工智能的一个抓手,从大量的信息来源抽取所需要的信息。举例,公安大数据体系里面有标签体系,如,行为人、自然人的一些身份信息、背景信息,然后再把这些自然人的轨迹信息、人跟人之间的关系信息等搜集、凝练、融合,就形成了一个公安数据的情报图谱。

  公安数据的情报图谱我们已经做到什么程度了?系统现在已经部署到30多个地市级公安局。其中有一个公安系统中就有约16亿个实体、40亿个连接、140亿个事件,这个数据现在是非常大的。在明略数据,运用知识图谱、认知人工智能等手段,构建人员、组织、事件、轨迹基础库,完善群体监测、事件研判两大应用,充分利用各项动态数据,提高群体轨迹监测动态预警能力医疗器械企业,以群体的轨迹数据结合文本情报线索为基础,实现人事时空的关联,进一步提高预警研判的准度、精度。

  情报研判基于不同的信息来源,不同的人物、组织、地名、事件信息来源,最终形成一个公安行业大脑。其中,我们也要做一些量化模型分析,还涉及到很多的基础设计。概括起来,明略数据的“公安大脑”用知识图谱数据库帮助警察破案可以做到事半功倍。

  1、从大数据到大知识: HACE + BigKE,吴信东, 何 进, 陆汝钤, 郑南宁 ,其中第4节展望了6个挑战和6个应用场景。

  2、数据挖掘的10大算法(英文)这篇文章 Google Scholar的引用次数今天是3941。

  3、大数据的HACE定理和三层处理模型:这篇文章自2014年1月发表,到2015年6月,连续18个月在IEEE(1884年开始)的所有会议和期刊论文中每月下载量全球第一,2015月7月全球第二,2015年8月全球第三,开创了一个IEEE记录。Google Scholar的2018/08/02引用次数是1613。

  4、大数据知识工程:这篇论文对大数据时代的知识工程及其核心问题进行了定义,提出了一个BigKE模型,是同郑南宁院士、陆汝钤院士等一起做的。以这篇论文的纲领性设计为驱动,2016年我们成功获批了一个4千5百万的科技部重点研发计划项目(.

  5、负向关联规则挖掘:这篇文章Google Scholar的今天引用次数是499。

  6、特征流环境下的在线特征选择:这篇文章Google Scholar的今天引用次数是116。

  量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

  此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

  进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

  量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

  谷歌AI搜索闯大祸!建议网友吃石头、毒蘑菇,把胶水加到披萨上,评论区炸了

  桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

  英伟达股价首次破1000美元!黄仁勋:Token生意将创造100万亿价值

  百川新模型冲顶中文测试基准!首款AI助手“百小应”同时发布,“最懂搜索”

与明略科学院院长、IEEE Fellow吴信东:大数据知识医疗器械企业工程基础理论 直播课笔记相关的其他内容

网站地图 txt地图