文章詳情頁
mysql - 5千萬文章,怎么做相關(guān)文章?
瀏覽:131日期:2022-06-12 18:04:51
問題描述
現(xiàn)在我是按標(biāo)題分詞,每個(gè)標(biāo)題3個(gè)詞單獨(dú)建了個(gè)tags表,用來存放分的詞,每個(gè)詞一條記錄,讀取相關(guān)文章是隨機(jī)讀一條tag,之后查找tags表相同tag,以前數(shù)據(jù)少的時(shí)候還可以,現(xiàn)在tags表里1億多條數(shù)據(jù)了,讀起來超級慢tags表只有2個(gè)字段,一個(gè)文章id,分詞,都做了索引,之后分區(qū)。請問還有其他方法做相關(guān)文章的么?現(xiàn)在每天新增數(shù)據(jù)5W+++
問題解答
回答1:相關(guān)性的衡量,應(yīng)該有好幾個(gè)維度:1,文章所屬板塊,比如娛樂2,文章中心思想或者主題是啥,要提取出來3,時(shí)間和主要對象(人物、事件)相關(guān)
一篇文章可能有多個(gè)主體對象,可能跨板塊進(jìn)行關(guān)聯(lián)
排行榜

熱門標(biāo)簽