您現(xiàn)在的位置:首頁 > 背景提升 > 數(shù)據(jù)科學課題-基于數(shù)據(jù)挖掘的推薦系統(tǒng)研究
驗證碼

獲取驗證碼

數(shù)據(jù)科學課題-個性化廣告推送原理:基于數(shù)據(jù)挖掘的推薦系統(tǒng)研究


項目背景

當你發(fā)現(xiàn)刷抖音停不下來,當你在朋友圈里看到精準的廣告投放,當你讓Siri規(guī)劃回家路線,這背后的強大驅(qū)動力便是數(shù)據(jù)挖掘與機器學習。數(shù)據(jù)挖掘又稱知識發(fā)現(xiàn),即從數(shù)據(jù)中挖掘知識。在當下信息爆炸時代,面對龐大的數(shù)據(jù)庫,最主要的困難就是有效信息難以提煉, John Nalsbert稱之為“信息豐富而知識貧乏”窘境。因此,對海量數(shù)據(jù)進行深入分析,發(fā)現(xiàn)并提取隱藏在其中的信息,以更好地利用這些數(shù)據(jù)的需求愈發(fā)強烈。但僅以數(shù)據(jù)庫系統(tǒng)的錄入、查詢、統(tǒng)計等功能,無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢,更缺乏挖掘數(shù)據(jù)背后隱藏知識的手段。正是在這樣的條件下,數(shù)據(jù)挖掘技術應運而生。項目將圍繞數(shù)據(jù)挖掘原理及其在推薦系統(tǒng)中的應用展開。

項目介紹

項目中,導師將介紹用于知識發(fā)現(xiàn)的大數(shù)據(jù)挖掘的基礎編程模型和算法。學生對其代碼實現(xiàn)后,將使用真實生活中的數(shù)據(jù)集(如Yelp評論、亞馬遜交易和MovieLens數(shù)據(jù)等)進行模型訓練,并檢測出有意義的用戶偏好及習慣。在項目中后期,學生將結(jié)合所學知識及導師建議對基礎推薦算法及模型進一步優(yōu)化研究,構(gòu)建一個新穎、準確且高效的個性化推薦系統(tǒng),并在項目結(jié)束時提交項目報告、進行成果展

個性化研究課題參考 

構(gòu)建基于內(nèi)容的電影推薦系統(tǒng) 

構(gòu)建基于協(xié)同過濾的推薦系統(tǒng)

構(gòu)建一個混合位置的餐廳推薦系統(tǒng)

數(shù)據(jù)挖掘其他應用如:使用公開數(shù)據(jù)進行空氣質(zhì)量預測和預報

適合人群

高中生/大學生

數(shù)據(jù)科學、機器學習、計算機科學、軟件工程、數(shù)學等專業(yè)方向或者對上述方向感興趣的學生; 學生需要掌握線性代數(shù)及概率論與數(shù)理統(tǒng)計知識,至少熟練使用一門編程語言并修讀過算法與數(shù)據(jù)結(jié)構(gòu),有數(shù)據(jù)分析項目相關經(jīng)驗的申請者優(yōu)先

導師介紹

南加州大學 終身教授

Yao-yi導師現(xiàn)任南加州大學空間科學終身教授,空間計算實驗室主任,南加州大學(USC)美國國家科學基金會綜合媒體系統(tǒng)中心(IMSC)副主任。導師同時在南加州大學維特比數(shù)據(jù)科學碩士項目中擔任教學工作。導師目前的研究將空間科學理論與計算機算法相結(jié)合,從異構(gòu)數(shù)據(jù)中發(fā)現(xiàn)新見解,以解決現(xiàn)實世界的問題。他的研究興趣包括信息集成、機器學習、數(shù)據(jù)挖掘、計算機視覺和知識圖譜。他獲得了來自諸如NSF、NIH、DARPA、NGA和NEH等機構(gòu)的資金。導師曾在谷歌AI (NYC)進行研究,并曾就職Facebook空間計算小組的機器學習顧問。

任職學校

南加州大學(University of Southern California,USC)創(chuàng)立于1880年,坐落于美國加州洛杉磯市中心,是全球領先私立研究型大學,美國最具多元化學府之一,廣受全球博才智杰推崇。南加州大學是美國大學協(xié)會(AAU;研究型大學聯(lián)盟,會員門檻極高,被許多機構(gòu)視為衡量大學學術研究和品質(zhì)的基準)的成員,在2020年U.S.News全美大學數(shù)據(jù)科學專業(yè)排名Top7。

項目大綱

面向大規(guī)模數(shù)據(jù)處理的并行計算模型和方法

頻繁項級挖掘算法及關聯(lián)規(guī)則 

聚類分類與數(shù)據(jù)降維 

推薦系統(tǒng) 

學術研討1:教授與各組學生探討并評估個性化研究課題可行性,幫助學生明晰后續(xù)科研思路 

學術研討2:學生將在本周課前完成程序設計原型(prototype)及偽代碼(Pseudocode),教授將根據(jù)各組進度進行個性化指導,確保學生優(yōu)質(zhì)的終期課題產(chǎn)出 

項目成果展示

論文輔導 

時間安排與收獲

7周在線小組科研學習+5周論文輔導學習 共125課時

學術報告

優(yōu)秀學員獲主導師Reference Letter

EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發(fā)表(可用于申請)

結(jié)業(yè)證書

成績單


更多課程分類
驗證碼

獲取驗證碼