MMR (Maximal Marginal Relevance)
適用於單文件摘要,
其概念乃是對所挑選出與Query相關的語句重新排序,
以符合具有最大相關度及最大差異度的特性。
MMR-MD 延伸MMR 的概念,
可有效降低摘要中具有相同涵義的語句(即,減少重複性資訊)。
MMR-MD 同時考慮到時間順序、專有名詞、對主題的相似度以及代名詞的Penalty。其挑選段落的依據如下:
Word co-occurrence:假如兩個段落有許多相似的字,則可視為相似。
Matching noun phrases:利用LinkIt [26]判斷是否擁有互相關聯的名詞片語群組。
WordNet synonyms:使用WordNet [27]找出同義詞組。
Common semantic classes for verb:判斷具有同一語意的動詞詞組。
接著利用Information Fusion 的技術,從主題中萃取出具有代表性的詞組或片語。同時依照出現
在文章中的次序,對片語排序。最後,藉由FUF/SURGE [9]自然語言產生器生成完整語句。
网络资源的拷贝粘贴 备份参考之用
Subscribe to:
Post Comments (Atom)
Blog Archive
-
▼
2007
(77)
-
▼
02
(27)
- 美国艺术三百年 [活动预告]
- 19岁出门远行
- Coldplay - The Scientist { 歌词 }
- Tintin
- 宽宽信箱与出埃及记
- 调色板
- Is That Me? -- Google doodle for Chinese New Year
- 《牛皮》 - 一梦三四年
- 穷得只剩下电影
- 关于 UTF8 编码
- 什么是 MMR - Maximal Marginal Relevance
- Neil Gaiman's Son Working at Google
- VC字符串转换
- Smoke and Mirrors - Neil Gaiman
- Keso大叔总是那么酷
- 雪人儿和叮当
- 法语学习资源
- 比赛赢了
- Foosball Poster
- 意大利面之年
- 回顾Google China的2006年
- 两篇关于Second Life的中文报道
- Cover Story of Bussiness Week -- about Second Life
- 莫扎特钢琴奏鸣曲全集
- 希腊罗马神话和圣经中的英语典故 [zz]
- An Inside Look at Google China
- Recall, Precision & F
-
▼
02
(27)
-
{
New Yorker
(11)
}
{
fiction
(11)
}
{
Programming
(9)
}
{
people
(7)
}
{
Google
(6)
}
{
algorithm
(5)
}
{
Internet
(4)
}
{
MIT Media Lab
(4)
}
{
photo
(4)
}
{
picture
(4)
}
{
United States presidential election 2008
(3)
}
{
book
(3)
}
{
冯象
(3)
}
{
电影
(3)
}
{
Erik Demaine
(2)
}
{
Information Retrieval
(2)
}
{
Neil Gaiman
(2)
}
{
Power Law
(2)
}
{
Steve_Jobs
(2)
}
{
movie
(2)
}
{
典故
(2)
}
{
思维的乐趣
(2)
}
{
Art
(1)
}
{
Auto Summarization
(1)
}
{
Barack Hussein Obama
(1)
}
{
Classical Music
(1)
}
{
French
(1)
}
{
Gallery
(1)
}
{
Google Video
(1)
}
{
HARUKI MURAKAMI
(1)
}
{
Hilary Clinton
(1)
}
{
Javascript
(1)
}
{
Psychology
(1)
}
{
cheat sheet
(1)
}
{
data structure
(1)
}
{
foosball
(1)
}
{
lyrics
(1)
}
{
movie making
(1)
}
{
music
(1)
}
{
poem
(1)
}
{
ranking
(1)
}
{
wikipedia
(1)
}
{
三联生活周刊
(1)
}
{
拍电影
(1)
}
{
数学之美系列
(1)
}
{
村上春树
(1)
}
{
算法
(1)
}
{
美术馆
(1)
}
No comments:
Post a Comment