微信邦

 找回密碼
 立即注冊

QQ登錄

只需一步,快速開始

掃一掃,訪問微社區

返回列表 發新帖
查看: 922|回復: 0
打印 上一主題 下一主題

2019年CCF-騰訊犀牛鳥基金項目課題介紹(一)——智慧教育&機器學習

[復制鏈接]
跳轉到指定樓層
樓主
發表于 2019-5-30 22:39:21 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
生活圈制作
CCF-騰訊犀牛鳥基金由騰訊與中國計算機學會聯合發起,旨在為全球范圍內最具創新力的青年學者搭建產學研合作及學術交流的平臺,提供了解產業真實問題,接觸業務實際需求的機會,并通過連接青年學者與企業研發團隊的產學科研合作,推動雙方學術影響力的提升及應用成果的落地,為科技自主研發的探索和創新儲備能量。

本年度共設立9個重點技術方向,29項研究命題
申報截止時間:2019年6月15日24:00
我們將分四期對研究命題進行詳細介紹
本文將介紹智慧教育機器學習
歡迎海內外青年學者關注并申報。

一、智慧教育
智慧教育是本年度唯一的開放課題,旨在促進人工智能、大數據、云計算等前沿技術與教育管理,課堂教學等教育場景的融合,推動創新教育范式的革新。

1.1 “未來+教育”智慧教育技術研究

在信息技術的推動下教育領域經歷了數字化、網絡化、移動化的變革,正在逐步進入智能化時代。信息技術特別是智能技術正在推動教育范式的革新。教育的組織體系、教與學的模式、服務方式、人才培養體系等方面都在發生深刻變革。本課題希望能夠促進信息技術與教育技術的交叉融合,探索基于人工智能、大數據、云計算等技術的“個性化”、“多模態”、“無邊界”的教育范式。

建議研究方向:
1)  數據驅動的教育技術與應用探索,如多維度教育數據采集與智能分析、教育大數據分析與應用、智能學習分析與評測、自適應個性化教輔、智能教學管理等;
2)  智慧學習環境研究與應用,如知識工程驅動的教育資源組織與優化、情境感知的泛在網絡學習環境、群體智能與協同學習研究,多模態學習資源組織與推薦等。

二、機器學習
機器學習研究伴隨著人工智能的興起而變得越發關鍵。本年度該領域依然呈現出理論型研究和應用型研究相融合的特點。隨著研究領域逐漸擴大,研究者將有機會將機器學習的研究成果在包括AI醫療、機器翻譯、社交廣告等業務場景中予以實踐。

2.1 深度學習在大規模程序分析領域的
應用研究

隨著軟件復雜度的不斷提升,大規模源代碼和二進制程序的漏洞挖掘工作面臨新的機遇和挑戰。計算機語言和自然語言有相似之處,但又存在著獨特的語法結構和分析技術。本研究項目希望把深度學習相關技術(例如自然語言處理、圖嵌入等)應用于大規模程序分析工作中,其成果可能對傳統的漏洞挖掘工作有較大促進。

建議研究方向:
1)程序語言或機器語言的函數級別表征研究,例如用于異構二進制函數的相似性比對;
2)計算機語言的自動生成技術研究,例如自動生成符合語法結構的程序代碼用于編譯器(解釋器)模糊測試;
3)基于程序語義表征的安全屬性分析研究,例如API誤用分析,已知/未知漏洞檢索等。

2.2 機器學習在新藥研發中的關鍵技術研究

人工智能技術已經在圖像、醫療、安全等領域取得了顯著成果。利用人工智能技術進行新藥研發是近期制藥領域的熱點研究問題之一。藥物研發中的蛋白質折疊、分子逆合成路線設計、分子生成等傳統研究問題一直是制藥領域的巨大挑戰。人工智能技術中深度圖網絡、強化學習、生成對抗網絡等方法都是解決制藥領域這些熱點研究問題的鑰匙。而如何設計新的人工智能相關技術,來幫助降低藥物研發成本與時間周期仍是一個具有挑戰性的研究。

建議研究方向:
1)蛋白質折疊:探索新深度圖網絡或深度學習算法,從基因序列來預測蛋白質分子的三維結構;
2)分子逆向合成路線設計:研發新的強化學習并對目標分子進行遞歸式拆分,最終獲得更簡單、更容易合成的原料,從而完成路線的設計;
3)分子生成:研究生成對抗網絡或變分自編碼器等技術,生成滿足一定功能要求的新分子機構或一級序列。

2.3 面向低資源的小語種口語機器翻譯研究

本課題主要圍繞民漢翻譯存在的兩個核心問題進行研究。其一是小語種面臨的低資源和零資源的問題。例如在有少量或完全沒有平行語料的情況下,如何利用單語語料,通過半監督或完全無監督的方式進行機器翻譯學習。
其二是如何在低資源的語音識別狀況下,降低因口語化表達導致的機器翻譯錯誤率。例如因為表達停頓,使用語氣詞、口頭語等導致的翻譯文本分段錯誤或語義理解錯誤等。

建議研究方向:
1)在有少量平行語料的情況下,如何利用單語語料,通過半監督或無監督的方式進行學習;
2)利用中間語言的方式,通過多任務學習的方式進行學習;
3)利用已有高資源的雙語數據,通過遷移學習的方式,學習低資源或者零資源的NMT系統;
4)探索通過融合文本信息和VAD的智能斷句修復技術;
5)基于Transition-based RNN等深度學習算法,探索利用序列標注的方法,降低因口語話表達導致的機器翻譯錯誤問題。

2.4 3D場景在深度學習模型中的
表示學習方法研究

3D游戲中的場景,通常通過數量龐大的多邊形網格進行構建。對于移動游戲而言,單一場景的多邊形數一般在幾十萬到幾百萬個,單一的人物多邊形數在幾千到幾萬個。同時,多邊形網格的數據表現形式又較為復雜。因此,對于在復雜3D場景中的深度神經網絡應用來說,難以直接從如此龐大且復雜的數據中進行學習。本課題的主要目標是面向復雜3D場景進行表示學習的研究,以得到一個較為便利的數據表示形式,從而應用在不同方向的深度學習模型中。

建議研究方向:
1)通過圖形學方法對原始模型進行變換;
2)構建模型對變換后的數據進行表示學習;
3)在給定環境中測試表示學習的效果。

2.5 面向廣告推薦場景下的
DNN模型結構自動學習研究

大規模DNN模型在各種廣告推薦場景中發揮著越來越重要的作用,從觸發召回到排序精選,各個環節基本都被DNN模型主導。目前模型結構大都依靠人工設定,隨著Auto ML技術的發展,如何自動學習、優化模型結構,加強特征交互學習,提高建模效果,降低人工調參成本,對提升廣告點擊率、轉化率預估,建構優質廣告候選觸發模型等起著至關重要的作用,并對推動實際業務發展具有重要意義。

建議研究方向:
1)淺層(10層以下)全鏈接DNN模型結構參數自動學習;
2)淺層模型引入attention、CNN、RNN等網絡結構,自動學習優化;
3)提高模型結構自動學習的技術目標,即性能可控的條件下提升建模效果,或效果持平條件下簡化結構提升性能。


分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友 微信微信
收藏收藏
回復

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規則

微信邦網聯系QQ|Archiver|手機版|小黑屋|魯公網安備 37082802000167號|微信邦 ( 魯ICP備13013993號-5

GMT+8, 2019-7-3 16:25 , Processed in 0.138164 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Wxuse Inc. | Style by ytl QQ:1400069288

快速回復 返回頂部 返回列表
平特不出最多几期