网络资源的拷贝粘贴 备份参考之用


16 February 2007

什么是 MMR - Maximal Marginal Relevance

MMR (Maximal Marginal Relevance)

適用於單文件摘要,
其概念乃是對所挑選出與Query相關的語句重新排序,
以符合具有最大相關度及最大差異度的特性。

MMR-MD 延伸MMR 的概念,
可有效降低摘要中具有相同涵義的語句(即,減少重複性資訊)。

MMR-MD 同時考慮到時間順序、專有名詞、對主題的相似度以及代名詞的Penalty。其挑選段落的依據如下:
Word co-occurrence:假如兩個段落有許多相似的字,則可視為相似。
Matching noun phrases:利用LinkIt [26]判斷是否擁有互相關聯的名詞片語群組。
WordNet synonyms:使用WordNet [27]找出同義詞組。
Common semantic classes for verb:判斷具有同一語意的動詞詞組。
接著利用Information Fusion 的技術,從主題中萃取出具有代表性的詞組或片語。同時依照出現
在文章中的次序,對片語排序。最後,藉由FUF/SURGE [9]自然語言產生器生成完整語句。

No comments:

Google