接觸式讀票機(jī)(Contact-based)
原理:通過(guò)物理接觸(如金屬觸點(diǎn))檢測(cè)選票上的導(dǎo)電標(biāo)記(如特殊墨水填涂),形成電路導(dǎo)通來(lái)識(shí)別選擇。
特點(diǎn):
識(shí)別速度快,但對(duì)選票材質(zhì)和標(biāo)記墨水要求高。
易受污漬、折疊影響,應(yīng)用場(chǎng)景較窄。
選票讀票機(jī)是現(xiàn)代選舉數(shù)字化的核心工具,其技術(shù)演進(jìn)始終圍繞 “效率、準(zhǔn)確、” 三大目標(biāo)。盡管存在技術(shù)爭(zhēng)議,但通過(guò)標(biāo)準(zhǔn)化流程、多重審計(jì)機(jī)制和技術(shù)迭代,讀票機(jī)正逐步成為保障選舉公正的重要支撐。在應(yīng)用中,需結(jié)合地區(qū)電子化水平、選民習(xí)慣及需求,選擇適配的技術(shù)方案,同時(shí)強(qiáng)化人工監(jiān)督與法律規(guī)范,確保技術(shù)為民主選舉賦能。
特征提取與判斷:識(shí)別選民的選擇意圖
根據(jù)選票標(biāo)記類(lèi)型(填涂、勾選、手寫(xiě)符號(hào)等),算法采用不同的特征提取策略:
(1)填涂標(biāo)記識(shí)別(常見(jiàn)場(chǎng)景)
面積占比法:計(jì)算填涂框內(nèi)黑色像素占比,超過(guò)閾值(如 30%-50%)則判定為有效選擇。
例:選民使用 2B 鉛筆填涂候選人 A 的方框,掃描后該區(qū)域黑色像素占比達(dá) 45%,算法判定為有效投票。
邊緣檢測(cè)法:通過(guò) Canny 或 Sobel 算子檢測(cè)填涂區(qū)域的邊緣輪廓,與標(biāo)準(zhǔn)填涂形狀(如矩形、圓形)比對(duì),排除不規(guī)則標(biāo)記(如筆尖打滑形成的短線)。
濃度梯度分析:填涂越均勻的區(qū)域,灰度值分布越集中,算法可通過(guò)統(tǒng)計(jì)像素灰度方差來(lái)區(qū)分 “認(rèn)真填涂” 與 “輕微觸碰”。
(2)勾選或手寫(xiě)符號(hào)識(shí)別
形態(tài)學(xué)分析:通過(guò)膨脹、腐蝕等形態(tài)學(xué)運(yùn)算,將勾選符號(hào)(√)或手寫(xiě)標(biāo)記(如 “○”)轉(zhuǎn)換為標(biāo)準(zhǔn)形狀,再與預(yù)設(shè)模板匹配。
方向特征提?。簩?duì)于斜線標(biāo)記(如 “/”),計(jì)算像素分布的梯度方向,判斷是否符合 “勾選” 的典型角度(如 45° 或 135°)。
(3)異常標(biāo)記檢測(cè)
多選判定:同一候選區(qū)域內(nèi)檢測(cè)到多個(gè)標(biāo)記(如同時(shí)填涂?jī)蓚€(gè)候選人框),或單票標(biāo)記數(shù)超過(guò)規(guī)定(如總統(tǒng)選舉多選 1 人),則判定為無(wú)效票。
空白票識(shí)別:所有候選區(qū)域標(biāo)記面積均低于閾值,判定為未投票。
4. 結(jié)果驗(yàn)證與輸出:確保計(jì)數(shù)準(zhǔn)確性
重復(fù)校驗(yàn):對(duì)關(guān)鍵標(biāo)記區(qū)域進(jìn)行多次掃描(如兩次獨(dú)立圖像采集),結(jié)果一致才確認(rèn)有效。
人工復(fù)核接口:對(duì)算法判定存疑的選票(如填涂面積接近閾值、標(biāo)記形狀模糊),生成圖像供選舉工作人員人工審核(如美國(guó)部分州要求對(duì) “爭(zhēng)議票” 進(jìn)行人工查驗(yàn))。
數(shù)據(jù)輸出:將識(shí)別結(jié)果轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)(如候選人 ID、得票數(shù)),同步至中央數(shù)據(jù)庫(kù)或打印紙質(zhì)統(tǒng)計(jì)表。
軟件算法:從識(shí)別精度到防篡改機(jī)制
1. 多重校驗(yàn)算法架構(gòu)
重復(fù)掃描比對(duì):對(duì)每張選票進(jìn)行至少 2 次獨(dú)立掃描(間隔 50ms),比對(duì)兩次圖像的像素差異,若標(biāo)記區(qū)域灰度值偏差超過(guò) 15%,則觸發(fā)第三次掃描并人工介入(如日本選舉法要求對(duì)爭(zhēng)議票進(jìn)行三次掃描)。
多特征融合判斷:結(jié)合填涂面積、邊緣輪廓、灰度梯度等多維度特征,采用加權(quán)投票機(jī)制(如面積占比權(quán)重 40%+ 邊緣匹配度權(quán)重 30%+ 濃度均勻性權(quán)重 30%),避免單一特征誤判(例:某區(qū)域面積達(dá)標(biāo)但邊緣鋸齒狀,可能被判為 “無(wú)意涂抹”)。
機(jī)器學(xué)習(xí)模型迭代:利用歷史選舉的有效 / 無(wú)效票數(shù)據(jù)(如美國(guó) EAC 公開(kāi)的選票數(shù)據(jù)集)訓(xùn)練 CNN 模型,對(duì)非標(biāo)準(zhǔn)標(biāo)記(如超框填涂、輕描標(biāo)記)的識(shí)別準(zhǔn)確率提升至 99.2% 以上。
2. 防篡改與數(shù)據(jù)完整性保護(hù)
哈希值校驗(yàn):對(duì)每張選票的掃描圖像生成哈希值(如 SHA-256),存儲(chǔ)于區(qū)塊鏈節(jié)點(diǎn)或加密數(shù)據(jù)庫(kù),任何圖像修改都會(huì)導(dǎo)致哈希值變更,可實(shí)時(shí)檢測(cè)數(shù)據(jù)篡改(如德國(guó)部分州采用區(qū)塊鏈存證選票圖像)。
軟件版本控制:讀票機(jī)操作系統(tǒng)與識(shí)別算法采用簽名固件更新機(jī)制,僅允許通過(guò)官方渠道推送的版本(附帶數(shù)字證書(shū))安裝,防止惡意程序植入(如 2018 年美國(guó)佛羅里達(dá)州選舉前,對(duì)所有讀票機(jī)進(jìn)行固件哈希值比對(duì),攔截 3 臺(tái)異常設(shè)備)。