2017 CCF大数据与计算智能大赛走进武汉大学讲座(2场)
类别:未知 发布人:admin 浏览次数: 次 发布时间:2017-10-19 08:43
活动时间:2017年10月21日18:00
地址:外围投注365B403
活动日程:
18:00-18:30     签到
18:30-19:30     报告题目,徐君,计算所研究员
19:30-20:30     报告题目,邹磊,北京大学教授副教授

主题1:强化排序学习
摘要:排序学习研究在近十年来取得了长足的进展并在商业搜索系统中得到了广泛的应用,现有的排序学习模型大多基于相关性独立性假设,对待排序文档独立打分并排序。上述假设简化了排序流程和学习的难度,同时也限制了排序学习在更复杂排序场景和更多排序任务上的应用。本报告将介绍一种基于马尔科夫决策过程的强化排序学习框架,其将文档排序任务形式化为序列决策过程,每一次的决策依据当前状态进行,为当前位置选择一个文档,逐步构建文档序列。强化排序学习框架可以自然地建模包括多样化、交互式在内的多种排序学习任务,其已经被成功应用于相关性排序和多样化排序任务中并取得了显著的性能提升。
 
报告人简介:徐君,中国科学院计算技术研究所研究员、博士生导师。徐君于2006年毕业于南开大学,获博士学位,毕业后先后就职于微软亚洲研究院和香港华为诺亚方舟实验室,历任副研究员、研究员和资深研究员,于2014年加入中科院计算所,任研究员。徐君的主要研究方向为用于信息检索的排序学习算法和系统,其在包括SIGIR、WWW、WSDM等国际学术会议和JMLR、TOIS、TIST等国际学术期刊发表论文50余篇,撰写英文专著1本,获美国专利授权8项,部分成果应用于微软和华为公司的搜索产品,在信息检索开源软件Lemur中获得推广,其创建的交互式图形化机器学习开源系统Easy Machine Learning受到了业界的关注。徐君担任多个国际学术会议和期刊的程序委员会委员(PC)和审稿人(Reviewer),任ACML 2015~2018和SIGIR 2017资深程序委员会委员(Senior PC)。


主题2:基于图的海量知识图谱数据管理
 摘要:RDF用W3C提出是对于语义网中的Web对象建模的数据模型。目前,已经涌现出大量的RDF知识库,比较著名的有DBPedia,Yago,Yago2和Freebase等。同时,很多IT公司也在致力于大规模RDF知识库的构建,例如Google的知识库图谱,微软的Satori,搜狗公司的知立方,以及百度的实体搜索。大规模RDF知识库为目前的数据管理领域带来了新的挑战和机遇,例如如何有效地存储和检索这些大规模的RDF知识库数据。
 
在本次的报告中,我首先回顾一些经典的按照关系数据库的方法来管理RDF数据的技术。然后,我集中讨论从图数据库的观点来研究RDF数据管理的问题。具体的,我将讨论如何利用图数据库中的子图匹配技术来处理RDF知识库中的查询问题。我讨论两种查询,SPARQL和自然语言查询,以及如何利用子图匹配来有效地回答这两类查询。最后,我将演示我们的基于图的RDF数据管理Demo系统,gStore和gAnswer;前者是用来设计支持SPARQL 1.1的RDF存储和查询系统,后者是用来支持自然语言和关键词的RDF语义检索系统
 
个人简历: 邹磊,北京大学计算机科学技术研究所副教授、国家自然科学基金委优秀青年基金项目获得者,北京大学大数据科学研究中心主任助理。目前的主要研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理。邹磊及其团队构建了面向海量RDF知识图谱数据(超过100亿三元组规模)的开源图数据库系统。邹磊已经发表了30余篇国内外学术论文,包括数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)近20余篇;其论文被引用超过1200多次(根据Google Scholar的统计),单篇最高被引用298余次。邹磊获得2009年中国计算机学会优秀博士学位论文提名奖和2014年中国计算机学会自然科学二等奖(排名第一)。

关于CCF 大数据与计算智能大赛:
大赛(BDCI)由中国计算机学会主办,已成功举办四届,是目前国内最权威的大数据类赛事之一。BDCI 2016 共吸引海内外6500余支队伍参赛,提交近三万次作品,创造世界大数据多题联赛参赛规模纪录。BDCI 2017 共开放12道赛题,2017年只剩下3个月,期待天才的你在众多珍贵的数据中徜徉探索,豪取奖金。
上一篇:2017年10月18日学术报告信息(Yier Jin,美国弗罗里达大学)
下一篇:11月15日学术报告信息(Yan Liu,UIUC)