算法里面涉及到的支持度和置信度是計(jì)算關(guān)聯(lián)度的兩種度量指標(biāo).用來(lái)反映相互之間聯(lián)系的有用性和確定性.支持度可以理解為支持的程度,也就是在一個(gè)集合中包含特別項(xiàng)目的概率,支持度越大,兩個(gè)商品被一起購(gòu)買(mǎi)的概率就越大.在統(tǒng)計(jì)學(xué)中,置信度表示一個(gè)樣本在某個(gè)總體參數(shù)的區(qū)間估計(jì).也就是說(shuō)用戶購(gòu)買(mǎi)了一個(gè)商品后,同時(shí)購(gòu)買(mǎi)另一個(gè)商品的概率.置信度越高,搭配購(gòu)買(mǎi)另一個(gè)商品的概率就越大,如果兩件商品作為套裝購(gòu)買(mǎi),則置信度最大為1.
假設(shè),購(gòu)買(mǎi)連衣裙和打底褲的支持度是10%.置信度是30%表示分析的所有購(gòu)買(mǎi)記錄中,同時(shí)購(gòu)買(mǎi)連衣裙和打底褲的頻率是10%,置信度30%則意味著購(gòu)買(mǎi)連衣裙的用戶也購(gòu)買(mǎi)了打底褲.
有時(shí)候買(mǎi)一種商品降低了另一種商品的可能性,所以我們要介入第三個(gè)概念-提升度.
提升度表示在有有A的情況下,同時(shí)含有B的可能性,與僅僅有B的情況的比值,
(1) 當(dāng)這個(gè)比值小于1表示這兩個(gè)商品之間存在負(fù)相關(guān)關(guān)系;也就是說(shuō),一個(gè)商品的出現(xiàn)會(huì)降低另一個(gè)商品出現(xiàn)的概率;
(2) 當(dāng)比值等于1的時(shí)候,這兩個(gè)商品之間不會(huì)相互影響;
(3) 當(dāng)比值大于1的時(shí)候,說(shuō)明這兩個(gè)商品之間存在正相關(guān)關(guān)系;提升度大于1的商品組合是是有潛力相互關(guān)聯(lián)的產(chǎn)品.
京東商家通過(guò)使用關(guān)聯(lián)營(yíng)銷(xiāo)算法來(lái)計(jì)算歷史訂單中各商品之間的相關(guān)購(gòu)買(mǎi)度,了解用戶的需求動(dòng)向,進(jìn)而提供一些在以往訂單中搭配購(gòu)買(mǎi)次數(shù)多的商品進(jìn)行關(guān)聯(lián).大家京東有什么疑慮,可聯(lián)系京濤老師15001054665!