該研討會介紹了與檢測垃圾郵件(無論是在社交網絡,評論還是其他在線出版物中)相關的工作。
本文是與世界網絡會議有關的一組文章的一部分www2012我們從4月16日至20日參加。更多信息在這裡。
例如,我們能夠從尤其是在Twitter上檢測垃圾郵件的Kyumin Lee的一些解釋,尤其是在Twitter上。憑藉他的技術,他設法在特定關鍵字上掌握了一定比例的垃圾郵件,並且在Twitter本人之前很久。我們邀請您通過此PDF更詳細地發現他的作品。
域的質量與詞彙質量和語言的選擇有關(主要是西班牙語和英語)。
評估網絡內容的最佳方法是基於事實信息。有3種不同的評估方法來評估網絡內容:
- 使用統計數據來確定質量。例如,提出的文章維基百科比其他人更長,並且包含更多的事實。
- 確定文章之間的關係數量。發行商越多,事實密度就越重要。
- 計算單詞的發生數量也可以評估文章中的事實數量。
製圖和網絡:
製圖的扭曲量越多,修改了梯子,準確性就越好,對位置評估的有效評估就越少。因此,我們傳遞了一張改進的虛擬卡,這留下了更多空間在元素之間。
OCR用於識別卡的元素。然後糾正錯誤,並在物理卡上確定位置。然後提取位置值,並在虛擬重新定位後重新創建空間。該方法尚未完全有效,但始終提供了改進,從可讀性方面則可以忽略不計。