- 相關(guān)推薦
年度研究工作簡(jiǎn)報(bào)
2014年度很快就過(guò)去了,一年下來(lái)忙忙碌碌,深感科研不易,且行且珍惜吧。作為總結(jié),寫(xiě)個(gè)博客算是2014年度主要研究工作的簡(jiǎn)報(bào)吧,歡迎多多指教。
1) 團(tuán)隊(duì)合作中的群體分配機(jī)制研究
團(tuán)隊(duì)合作逐漸成為科學(xué)研究的主要模式,打破了個(gè)人科學(xué)研究中貢獻(xiàn)和功勞的對(duì)稱,給功勞分配提出了嚴(yán)峻挑戰(zhàn)。為了區(qū)分團(tuán)隊(duì)成員在團(tuán)隊(duì)合作的貢獻(xiàn)大小,不同的學(xué)科所采取的策略差異很大,而現(xiàn)有方法大多基于作者順序或作者聲明的貢獻(xiàn)來(lái)確定每個(gè)人的功勞分配比例,無(wú)法應(yīng)對(duì)學(xué)科間規(guī)則差異大、實(shí)際貢獻(xiàn)難以量化等難題。針對(duì)該科學(xué)難題,我們提出了群體功勞分配方法(Collective Credit Allocation),該方法不再試圖量化個(gè)體的真實(shí)貢獻(xiàn),轉(zhuǎn)而采用“被感知的貢獻(xiàn)”(Perceived Contribution)作為功勞分配的依據(jù),利用共引用關(guān)系作為度量“被感知貢獻(xiàn)”的依據(jù)。該方法獨(dú)立于學(xué)科分配規(guī)則和作者順序等信息,能夠自適應(yīng)地量化個(gè)體從團(tuán)隊(duì)合作中獲得的功勞分配比例。預(yù)測(cè)諾貝爾獎(jiǎng)得主的實(shí)驗(yàn)表明,所提出的群體分配方法在預(yù)測(cè)準(zhǔn)確率上達(dá)到了86%,遠(yuǎn)高于基于作者順序和作者角色的方法。同時(shí),所提出的群體分配方法還可以幫助我們研究獲獎(jiǎng)帶來(lái)的馬太效應(yīng),并可用以比較不同學(xué)者在其共同領(lǐng)域中的影響力。論文題目為Collective credit allocation in science,于2014年8月發(fā)表在綜合性學(xué)術(shù)刊物美國(guó)科學(xué)院院刊PNAS上。
2) 信息傳播中的時(shí)間標(biāo)度研究
信息傳播中用戶間交互行為的時(shí)間間隔對(duì)于研究信息傳播具有重要的啟示作用,F(xiàn)有方法大多假設(shè)用戶間交互行為的時(shí)間間隔服從指數(shù)分布或泊松分布,基于該假設(shè)的模型和方法將數(shù)據(jù)按照時(shí)間進(jìn)行切片來(lái)研究,缺少大規(guī)模數(shù)據(jù)上的實(shí)證分析支持,且預(yù)測(cè)精度受限。我們以WISE 2012國(guó)際會(huì)議提供的新浪微博數(shù)據(jù)為基礎(chǔ),分析了用戶間交互行為的時(shí)間間隔分布。分析發(fā)現(xiàn),對(duì)于任意一個(gè)用戶和其任一關(guān)注者,他們之間的大部分轉(zhuǎn)發(fā)行為密集發(fā)生在一些較短的時(shí)間窗中,這些頻繁轉(zhuǎn)發(fā)的時(shí)間窗之間有大段的空白期,表明其間關(guān)注者很少轉(zhuǎn)發(fā)被關(guān)注者的微博。這表明用戶交互行為表現(xiàn)出了個(gè)體行為中時(shí)常觀測(cè)到的陣發(fā)現(xiàn)象:個(gè)體間短期的頻繁交互被長(zhǎng)期的沉默所間隔,時(shí)間間隔服從冪率分布,而不是現(xiàn)有模型所假設(shè)的指數(shù)或泊松分布;谠摪l(fā)現(xiàn),我們建立了一個(gè)含時(shí)模型(Decay Model),來(lái)估計(jì)和預(yù)測(cè)未來(lái)社會(huì)推薦的成功概率,并在新浪微博數(shù)據(jù)上進(jìn)行實(shí)證檢驗(yàn)。在任意比例的訓(xùn)練樣本下,所提出的含時(shí)模型都一致優(yōu)于現(xiàn)有不含時(shí)的基準(zhǔn)方法。當(dāng)訓(xùn)練樣本較少時(shí)優(yōu)勢(shì)更加明顯,表明含時(shí)模型只需少量樣本即可準(zhǔn)確估計(jì)影響力。論文題目為Temporal scaling in information propagation,于2014年5月發(fā)表在Nature旗下開(kāi)放訪問(wèn)的學(xué)術(shù)刊物Scientific Reports上。
3) 社交網(wǎng)絡(luò)上的高效影響最大化算法
影響最大化(InfluenceMaximization)旨在解決如何在網(wǎng)絡(luò)上選擇一部分初始種子用戶,由他們口口相傳將企業(yè)的產(chǎn)品或信息盡可能地推廣開(kāi)來(lái)。該問(wèn)題是在社交網(wǎng)絡(luò)或社會(huì)媒體上進(jìn)行口碑營(yíng)銷或病毒式營(yíng)銷的核心問(wèn)題。現(xiàn)有方法中,貪心算法精度高但速度低,啟發(fā)式算法速度快但精度無(wú)保障。為此,我們擬設(shè)計(jì)高效的影響最大化算法,從啟發(fā)式的角度切入研究影響最大化問(wèn)題,分析發(fā)現(xiàn)貪心算法所得的解集是一種自洽排序——節(jié)點(diǎn)的邊際影響力和它們的排序是自洽的。據(jù)此,我們提出直接通過(guò)尋找自洽排序來(lái)求解影響最大化問(wèn)題。我們提出一個(gè)迭代的框架IMRank,將任意給定的初始排序通過(guò)迭代調(diào)整的方式得到自洽排序。迭代框架包括兩個(gè)步驟:(1)根據(jù)當(dāng)前排序計(jì)算各個(gè)節(jié)點(diǎn)的邊際影響力;(2)按照邊際影響力對(duì)節(jié)點(diǎn)進(jìn)行重新排序。我們?cè)诶碚撋献C明了算法的收斂性,并在PHY、DBLP、EPINIONS、DOUBAN和LIVEJOURNAL等5個(gè)數(shù)據(jù)集上測(cè)試了IMRank的性能。實(shí)驗(yàn)結(jié)果表明,IMRank在計(jì)算效率上顯著超過(guò)了當(dāng)前最好的貪心算法和啟發(fā)式算法,計(jì)算精度和當(dāng)前最好的貪心算法相當(dāng)。論文題目為IMRank: Influence Maximization via Finding Self-Consistent Ranking,于2014年7月發(fā)表在信息檢索領(lǐng)域CCF A類會(huì)議SIGIR2014上。
4) 流行度動(dòng)態(tài)過(guò)程的建模與預(yù)測(cè)
在線社會(huì)關(guān)系網(wǎng)絡(luò)中,消息之間相互競(jìng)爭(zhēng)用戶的關(guān)注度。根據(jù)平均場(chǎng)理論,對(duì)于單個(gè)消息而言,其流行度可以視為該消息獲得關(guān)注的一個(gè)動(dòng)態(tài)過(guò)程。實(shí)證分析發(fā)現(xiàn),消息獲得關(guān)注的過(guò)程受到三個(gè)微觀機(jī)制的影響:(1)適者生存,即消息自身的吸引力對(duì)其最終的流行度起決定作用;(2)富者愈富,即消息的流行度越高越容易獲得新的關(guān)注;(3)時(shí)間效應(yīng),即隨著時(shí)間推移消息獲得關(guān)注的可能性會(huì)下降。針對(duì)該問(wèn)題,我們提出了一種基于自增強(qiáng)泊松過(guò)程(Reinforced Poisson Process)的概率模型,建模流行度動(dòng)態(tài)過(guò)程的上述三個(gè)微觀機(jī)制。該模型是一種產(chǎn)生式模型,直接建模各個(gè)消息獲得關(guān)注的過(guò)程,可再現(xiàn)整個(gè)在線社會(huì)關(guān)系網(wǎng)絡(luò)的流行度分布。進(jìn)一步,通過(guò)將消息自身的吸引力視為隱變量,并為其引入一個(gè)共軛先驗(yàn),采用貝葉斯框架對(duì)消息流行度進(jìn)行預(yù)測(cè),進(jìn)一步提高了預(yù)測(cè)的準(zhǔn)確度。以美國(guó)物理協(xié)會(huì)旗下11個(gè)期刊從1893年到2009年間的引文網(wǎng)絡(luò)為例,將論文的引用次數(shù)視為流行度,通過(guò)預(yù)測(cè)論文的引用次數(shù)來(lái)驗(yàn)證我們所提出模型的有效性。實(shí)驗(yàn)表明,所提出的基于自增強(qiáng)泊松過(guò)程的模型,在預(yù)測(cè)流行度方面顯著超過(guò)了基于時(shí)間序列自回歸的模型和對(duì)數(shù)回歸模型。論文題目為Modeling and Predicting Popularity Dynamics via Reinforced PoissonProcesses,于2014年7月發(fā)表在人工智能領(lǐng)域CCF A類會(huì)議AAAI 2014上。
【年度研究工作簡(jiǎn)報(bào)】相關(guān)文章:
課題研究年度總結(jié)11-16
工作簡(jiǎn)報(bào)08-06
工作簡(jiǎn)報(bào)通用08-13
寒假工作簡(jiǎn)報(bào)06-25
供暖工作簡(jiǎn)報(bào)11-24
疫情工作簡(jiǎn)報(bào)08-09