協同帳號 / 協同團體
在 Infodemic,是由帳號的活動行為而非推廣的內容來分辨『協同帳號』與『一般帳號』,偵測帳號的活動行為很像接受了由上而下的指令,包含但不限於:
- 活動的時間很一致,收集帳號的活動,比對他們發生活動的時間是否很一致。活動包含貼文,留言,分享等等行為
- 活動的地方很一致,在同樣的地方同時看到一樣的帳號,且在其他地方沒看到 (簡稱共進共出)。在同樣的地方同時看到一樣的帳號是指那些帳號留言,分享,按讚一樣的貼文或來源
- 不活躍的帳號,突然同時開始活躍
這些由上而下的行為一致不斷地持續被觀察到,由數月到數年,稱作『協同行為』,有協同行為的帳號稱作『協同帳號』,他們一起行動而變成『協同團體』。甚至,我們仔細檢驗這些協同帳號,可以看到更多令人可疑的特徵,包含但不限於:
- 帳號的大頭照是從網路上盜用的,且有多個帳號使用同樣的盜圖
- 同一個協同團體內,有多個帳號同時更換大頭照
- 有些帳號,使用中文名字,留言也是使用中文,很像是在地的使用者,但是從他們的帳號個人內容卻只看到外語 (通常是東南亞語系) 內容 這些可疑的特徵,隱含著這些帳號是由專門創建假帳號的人轉移來的,這背後是一個分工細緻的系統行動。
在 Infodemic,我們偵測帳號有很一致的活動行為,針對兩兩的帳號組合,計算出他們活動行為的一致度,建立出一張圖,點代表帳號,點之間的邊代表活動行為的一致度,接著執行 community detection algorithms,找到的群體就是『協同團體』,屬於協同團體的帳號就是『協同帳號』,其他不屬於任何協同團體的帳號就是『一般帳號』。每個帳號最多只會屬於一個協同團體。
在 Infodemic,有統計上的明顯差異證據,顯示協同帳號的活動行為高一致度相比一般帳號之間是極端少見的,且這樣極端少見的一致性是長時間不斷觀察到的。另外,我們也有資料科學家,檢驗證據,標註結果來衡量演算法的準確率。
一般的帳號,會因有共同的興趣,共同支持的人與意見,而觀察到部分有一致的行為活動,但比例不會像協同帳號之間那麼高,因為一般的帳號之間,也會有不同的興趣,不同支持的人與意見,而且不會在長時間一直持續觀察到高比例的一致行為活動。
在 Infodemic,收集了長時間的各協同團體的活動紀錄,整理出他們針對的對象,敘事與參與的議題,由此可歸納出他們的目的,再由目的去猜測背後的操作人或組織。利用這些初步的證據,由公權力去要求社群平台提供更深入的網路活動證據,如 ip 等等,而調查到背後的藏鏡人,甚至更深入取得金流證據。
在 Infodemic,收集了長時間的各協同團體的活動紀錄,也包含了境外勢力相關的組織活動,觀察統計協同團體是否與境外組織有持續的高度一致性行為活動,以此來判斷與境外勢力的關係。境外勢力組織包含:
- 境外政府的官方代表與宣傳管道,如: 政府的官方網站,或是政府在社群平台上的官方帳號
- 受境外政府控制的宣傳管道,政府的隨附組織,主要由政府管理或擁有的媒體組織等等所擁有的宣傳管道
- 與境外政府有連結的宣傳管道,沒有透明公開的資訊顯示與境外政府有關,但受到平台,情報組織,網路安全機構,政府或軍- 方等等組織,仔細檢驗非公開資訊而認定與境外政府有連結
目標 / 立場 / 敘事
在 Infodemic,我們收集了協同帳號所宣傳的各種內容,偵測裡面提到的 Entity 如人名,地名,組織名等等,辨別該內容對於提到的 Entity 的立場,是正面,負面,或中立,另外也對這些內容做語意上的分群,接著就可以以上述提到的項目為條件來篩選組織這些內容,再利用大型語言模型 (Large-Language-Model, LLM) 產生摘要,這些摘要就是協同帳號散播的敘事。
事件 / 議題
在 Infodemic,新聞文章與社群平台上的貼文與影片,利用 AI 的模型,分群在一起變成事件,再連結一連串的事件就變成了議題,分群的標準是從有新聞背景的人標註資料學習而來。
它是指事件/議題連結到的新聞文章的數量。
它是指事件/議題連結到的社群行為,目前社群行為只包含了留言,未來將加入貼文,分享,按讚(以及其他平台定義的互動)。
類似社群聲量(3-3)的定義,但是該行為是由協同帳號所為。
在事件/議題的表格中,累計聲量佔比表示由表格的第一行累計到該行,佔比整個表格多少比例的聲量。類似的,累計協同聲量佔比表示由表格的第一行累計到該行,佔比整個表格多少比例的協同聲量。
在 Infodemic,收集了長時間的協同帳號活動紀錄,也包含了境外勢力相關的組織活動,一同整理到事件/議題中,你可從介面上的國旗符號知道該事件/議題是否有境外勢力參與。境外勢力組織的定義請參考(1-6)。
訊息操作的影響
在 Infodemic,已經收集了協同帳號所操作的訊息,與他們的來源,還有散播至哪些管道,分析那些訊息管道的訂閱者,就可知道目標族群,分析他們的回應,就可知道造成的輿論影響。我們會在後續的產品更新釋出更完整細緻的操作介面來呈現這些影響力分析結果。
資料來源
Infodemic 的資料來源是每個國家或地區的主要新聞媒體與民眾主要使用的社群平台。
Infodemic 目前涵蓋了中文與英文的事件與議題,主要來自於美國,台灣,與中國。依需求擴充至其他語言與國家。
Infodemic 的社群資料爬蟲受限於我們的電腦資源與社群平台的流量限制,有上限,在此限制之下,我們依序爬取影響力較大的社群帳號之下的所有內容與內容下其他帳號的互動,且由這些有互動的帳號再找出更多有影響力的帳號。影響力是由粉絲數,文章的互動數等等來定義。初始的清單是由各社群平台的排行榜取得。
介面操作
點選表格的表頭,即可以該欄位排序,可由箭頭得知由大到小或由小到大 按著 Shift 再點選另一個欄位,就可同時排序多欄位