91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

PHP 基于laravel框架獲取微博數據之二 用戶數據的使用

發布時間:2020-05-26 19:04:53 來源:網絡 閱讀:655 作者:daweilang 欄目:web開發

項目地址:

https://github.com/daweilang/GetWB


開始抓取微博數據的時候,只是想獲得一條熱門微博下的所有評論,因為里面有不少圖片廣告,所以想試試能不能分析出熱門微博評論里的異常用戶。


使用PHP的Laravel框架后,通過隊列、命令等各種功能,最后構架了一套完整的微博用戶數據抓取平臺,經過一段時間的運行積累了大量數據,那么使用這些數據能做什么呢?


微博數據分析很早就有人在做了,網上采集分析工具貌似有很多,搜索一下想找一些微博數據分析的具體方案。世事變幻,發現很多幾年前的微博數據分析平臺都不能用了,可能微博數據分析和微博一樣在商業上還是沒有什么更好的盈利模式。。。


根據之前網上微博數據分析的方案,微博傳播力是數據分析的一個方向,熱門微博轉發傳播可以用于廣告營銷分析,這個數據基礎是采集微博內容和傳播路徑,和我的數據獲取方式并不相同。


沒有找到用戶數據分析的解決方案,也沒有數據挖掘相關知識的基礎,所以還是以一個程序員的角度說說微博用戶數據使用的設想吧。


使用Laravel框架搭建的平臺是以微博用戶為基礎的數據抓取模式,可以獲得某條微博下的所有評論、轉發和贊。進一步深入,獲得一個微博用戶的所有微博后,即可以獲得該用戶所發微博,包括其評論、轉發和贊的所有數據。


微博用戶的完整數據中能夠得到什么?


一、通過微博贊積累微博用戶
微博不能重復點贊,所以一條有百萬個贊的微博就能獲得百萬用戶基礎信息,這是積累微博用戶池效率比較高的方式,不過隨著累積量增加,重復數據變多,效率會降低。同樣評論和轉發也可以積累用戶信息,不過重復性使得獲取數據效率不高。



二、通過數據建立關于用戶的數學模型
早就把數學模型還給大學老師了,當年這東西也沒好好學。不過還是明白一點,一個用戶,其粉絲量、微博數和轉發、評論、贊應該有一定的數學模型關系。

具體來說,百萬級的微博用戶,其微博的平均轉發、評論、贊,應該在一定的范圍內。以大量微博用戶數據為基礎可建立數據模型。這種模型可以用來評估一個微博用戶的健康性。


三、通過數據獲得用戶的活躍粉絲
一個微博用戶的完整數據,通過交叉對比可以獲得粉絲的活躍度。

當前微博除了用戶自己,其他人是不能查看該用戶所有粉絲數據的。但是通過“共同關注”關系,可以判斷出是否是用戶粉絲。
理論上說如果有全部幾十億微博用戶數據,逐個對比,是可以獲取某用戶所有粉絲的,但這只是理論方案。
通過用戶微博下的轉發、評論、贊可縮小對比范圍,雖然不能得到用戶的所有粉絲,但能分析出和微博用戶有過互動的所有粉絲,這些粉絲的占比可以評估出微博用戶粉絲的質量。


以上就是通過微博用戶數據抓取平臺獲得的數據后在使用方面的一些設想。


作為一個程序員,還是不適合寫這種理論性的東西,自己都看不懂,還是好好寫程序去吧。。。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

辛集市| 石嘴山市| 武夷山市| 柳州市| 札达县| 三原县| 鹤庆县| 宁蒗| 东光县| 西贡区| 中方县| 文安县| 鹤山市| 舞钢市| SHOW| 正安县| 曲阳县| 巴东县| 大方县| 九台市| 广饶县| 元朗区| 祁门县| 潜山县| 秭归县| 永定县| 慈利县| 孝感市| 宜州市| 福贡县| 西宁市| 高台县| 张家界市| 共和县| 吐鲁番市| 开江县| 扶沟县| 建宁县| 乌拉特后旗| 华坪县| 安溪县|