1. 站長工具,就用查一把!
          收錄查詢  關鍵詞排名  Alexa排名  PR檢測  友情檢測  IP反查  WHOIS查詢    更多查詢  
            收藏  最近查詢 查一把
          信息分類 首頁 » 資訊信息

          好站推薦

          IT新聞

            業界猜想

            名人名企

          建站推廣

            站長創業

            運營推廣

          設計編程

            美工設計

            開發編程

          豆瓣私人電臺的推薦算法是怎樣的
          信息來源:查一把 發布時間:2012/3/13

          豆瓣的電臺應該分成三部分:
          1. 一部分是根據你的social行為推薦的音樂,例如你打分的專輯,你加入的標簽等等。
          2. 另外一部分是根據你使用電臺的行為推薦的音樂列表,這個估計是基于user-based或者item-based來計算的,數據就是喜歡、不喜歡和跳過。
          3. 第三部分應該是通過編輯加入的歌曲,例如在特定的時期對特定的人群發送特定的歌曲(一個例子是在大年初一聽到的第一首歌是新年祝福相關的)

          雖然只是這三部分,但是第一部分和第二部分會引入很多的參數,于是又有了一層算法:參數調優。這里有三種實現形式:所有用戶用同一組參數;每個用戶用不同的參數;先把用戶聚類,然后每類用戶用一組參數。

          這里的參數也會有很多種,一個關鍵在于比例的配置。例如,我們有15個源來產生推薦的歌曲,如何才能混合這些歌曲才能取得用戶最大的滿意度。理想情況是要同時考慮熟悉度、多樣度、和驚奇度。在具體算法中也有選擇多少個相似用戶、每個用戶對最終結果的影響度是多少、貢獻的數量是多少。再有就是如何從用戶聽過的成百上千的歌曲中選擇一個子集來進行后續的運算。當然,雖然這么說,但是千萬不要讓自己陷入其中,最重要是找到一個簡約的方案來調優。

          除此之外,不知道豆瓣可能還有另外一層的算法,就是即使給一個用戶準備好了一堆可以推薦的歌曲,應該按照什么順序來播放給用戶。這一點也能說出很多復雜的需要考慮的因素,我們在設計的時候也不要陷入在細節中,而應該找出最關鍵的幾點來撬動這個石頭:)

          最后,豆瓣也應該有個過濾的前端,會根據大家對一首歌的整體評分來決定后續推薦的音樂集合。

          豆瓣FM的推薦算法沒有停止,反而是在不斷演進當中,伴隨著它成長的用戶,會慢慢發現越來越多的驚喜與滿意。豆瓣FM是中國互聯網實踐個性化服務的一個很好的土壤,其中糅合了包括算法、UI/UE、數據清洗與整合、音頻分析技術、用戶行為分析、編輯與運營、后臺架構等等大量的因素,即便是推薦算法也只是算法技術中的一部分。單論推薦算法,就最簡單的算法,也會極大地受到其它因素的影響,比如單曲推薦功能、新版的上線,對于算法的學習與積累都會起到極大的正面作用。

          豆瓣的電臺算法會充分考慮數據的因素、人工的因素,借用UI/UE的力量,充分利用現有的各種智能技術,它是一個系統。

          一個個性化產品跟傳統的排行榜形式的推薦不一樣的其中一個難點在于質量的覆蓋面,它可以做到統計上逐漸逼近于讓所有人滿意的程度,但絕不是一個一蹴而就的工作,所以肯定還有大量不能令人滿意的地方,但每天它都在向著更好的方向走。

          總計收聽4763首,加心56首,1119首不在播放。下面我猜豆瓣私人電臺的推薦規則,請豆瓣的同學及阿北現身:

          1,社交行為
          在豆瓣音樂中,有哪些音樂標簽,喜歡哪些歌手,在聽哪些,想聽哪些,樂評,豆列等等,即豆瓣音樂中提供的社會化網絡行為,會有相關的權重算出一個公式,具體權重值暫時未知,其實也可以再進一步的猜,究竟哪些行為對用戶聽歌能產生更多的價值,權重值就高,否則次要。其實最開始的時候一定是一個最簡單的算法,在進行一段時間數據根據和用戶反饋后,有了更多的權重值累加。

          個人例子:

          2,聽歌行為
          “喜歡”,“不再播放”,“跳過” ,這個相對直白了。
          (1)喜歡:在以后的隨機播放中出現的次數會增加
          (2)不再播放:以后說byebye
          (3)跳過:以后還會隨機出現

          3,個人感受
          由于我并未在豆瓣音樂中進行過任何社會化行為操作,只是添加了幾個喜愛的歌手,所以豆瓣推薦給我的歌曲讓我很難受,太多不喜歡聽的歌曲持續出現。我的疑問

          (1)我添加的歌手都是中國歌手,為什么一直給我出英文歌曲
          (2)我喜歡的歌曲也全部是中文歌曲,且是慢節奏歌曲,為什么一直給我快節奏,重金屬的英文歌曲
          (3)我一直把英文歌曲不停的加入垃圾箱,還是持續不斷的給我推薦英文歌曲?
          (4)實在不知道我愛聽什么,哪怕放一些我喜歡的歌手都可以,可這個推薦的比率不足10%
           

          1。系統根據你所加的心和所選的喜歡歌手以及不再播放來進行調整概率這是肯定的。

          2。系統本身給歌曲打了很多標簽,隨機應該是根據這些標簽來算概率的,你加心的時候,同時對這類的標簽進行概率調整。

          3。在你加心的一段時間內,系統會不段給你推薦此類的歌曲,試圖試出你才口味,如果你沒有持續的加心則會降低概率。

          4。在播放歌曲的時候系統會隨機給你后臺播放頻率較高的歌曲,試圖測試你是否有其他的喜歡風格,這個概率出現得不多。

          5。豆瓣喜歡推薦英文歌曲。

          個人愚見算法可能是從一開始你選擇喜歡歌曲的時候就把相關的歌曲標簽全部導入至你的播放曲庫中,然后根據上述的幾個特點以及你的加心再去擴展播放曲庫,同時增加該標簽的隨機概率。

          個人看法:數據來源已經很清楚了,以下幾點:
          -用戶自己選擇的喜歡,不再播放,跳過
          -豆瓣上用戶對音樂的評分和收藏的專輯等等

          算法方面:應該是給歌曲或者專輯加上幾種不同的特征值(比如類型,歌手,語言,年代等等)用來標識一首歌的屬性,然后通過阿北和長生所說的一些推薦算法的整合... 有點類似圖像識別算法中的基于特征值的識別算法,如Mops,SIFT

          我自己的數據:加心146,垃圾箱253,總數4571
          對推薦的結果已經很滿意了,我覺得一方面是因為個人聽歌取向相對單一,比較容易推斷喜好,如果用戶在某些關鍵特征值上的取向模糊不清,經常做一些矛盾的加心和放入垃圾箱的選擇,那么自然會讓豆瓣的推薦算法更難得到好的結果...

          另外感覺中有一個細節:歌曲類別和語言在推薦算法中似乎很重要,而且豆瓣會試圖推斷用戶當下喜歡的歌曲類別并給予這一類歌曲一個臨時的高加權值...
          打個比方,我的喜好主要有經典搖滾,電影原聲,國語女聲,當我連續跳過幾首國語女聲后,電臺就會開始更多得播放經典搖滾得曲目,而極少回到國語女聲歌曲中...就算這不是豆瓣電臺有意為之,也會是個推薦算法中很有趣的嘗試...

          很簡單,我的使用經驗告訴我7成是根據你的“紅心”歌曲決定的。

          這里有一個訣竅:在豆瓣電臺里聽到了一首喜歡的歌便加紅心,這樣挺好,但是太慢;直接找到你喜歡的專輯頁面,把里面喜歡的歌曲全加上紅心,這里點的紅心是會同步到豆瓣電臺的收聽記錄里的,所以我的豆瓣電臺一直有個有趣的現象,就是加紅心的歌曲要比收聽的歌曲數目還多,這樣以后,我的私人電臺一直很服帖,我很喜歡。

          打個比方,你到一家大酒店去吃飯。你叫來經理說,給我推薦幾個適合我口味的菜。如果你是第一次來或者只來過幾次,經理不認識你,他只能推薦一些“招牌菜”,可是這些招牌菜實際上是來這家店的大多數人喜歡的,是一種民主的結果,而聽歌是種極為個人化的感受,所以你不一定會喜歡;如果你經常來這邊吃飯而且總是向經理反饋你的喜好,即使你是偏門的,經理也會知道你喜歡什么,甚至還會把某道招牌菜單獨給你改改口味送上來呢。當然,現實中不是所有人都能和大酒店經理交上話,所以人類發明了機器人。因此,這里反駁一下1樓阿北說的沒有"silver bullet",事實上"silver bullet"就是你告訴機器人你喜歡什么,現在的智能機器人,還沒聰明到比你自己更了解你自己,這是個事實,也是條穩妥的捷徑。

          當然,“垃圾箱”也是很重要的,但是只是“紅心”的小弟。
           

          針對答案里"經雷"說的"「不再播放」了十幾首王菲,還是不停的往上冒" 猜測補充一下:

          豆瓣私人電臺應該是根據以往興趣,隨機生成第一首.后續曲目會根據當前播放記錄,結合用戶興趣不停的迭代進行推薦.也就是說,第一首曲子很大程度上決定了此次播放的基調.
          這個猜測是根據前兩天在豆瓣上看到幾位負責豆瓣推薦研發的工程師聊天而得出的.

          分析了一下采取這種推薦的目的:
          這種推薦應該基于一個假設
          一個用戶可能同時喜歡古典樂和搖滾樂,在某次私人電臺播放過程中,曲風的大范圍跳躍會很影響用戶的使用體驗.想象一下上一首放莫扎特.下一首就放扭曲的機器.
          所以在滿足用戶各色喜好及保持當此播放曲風以維護用戶體驗之間,豆瓣選擇了后者.個人也很同意這種策略.只是缺點是放起來之后就回不來了.解決方法是,把電臺關了重開一遍.
           

          轉載請注明出處:站長工具 信息來源:http://www.ojpr.tw/Content/332
          網友點評
          辽宁十一选五开奖走势图