大數(shù)據(jù)體系會(huì)議論文選登
Social media account classification based on multimodal feature fusion
湯智偉,明 楊,費(fèi)高雷,翟學(xué)萌,胡光岷
doi: 10.19358/j.issn.2097-1788.2023.10.001
社交媒體賬號(hào)分類方法從賬號(hào)的屬性信息出發(fā),通過構(gòu)建賬號(hào)特征從而對(duì)賬號(hào)進(jìn)行分類,對(duì)從海量社交媒體數(shù)據(jù)中挖掘有價(jià)值的信息具有十分重要的作用。現(xiàn)有社交媒體賬號(hào)分類一般基于用戶發(fā)布的信息提取特征,存在賬號(hào)信息描述不完整、分類有效性低的問題。針對(duì)上述問題,提出了一種基于多模態(tài)特征融合的社交媒體賬號(hào)分類方法。該方法綜合考慮賬號(hào)自身屬性、文本以及賬號(hào)之間的社交關(guān)系等信息,使用張量分析的方法對(duì)賬號(hào)所表現(xiàn)的多模態(tài)特征進(jìn)行融合。相比現(xiàn)有方法,所提方法可以更好地利用賬號(hào)的各種信息,獲得更好的分類效果。通過實(shí)驗(yàn),所提方法準(zhǔn)確率達(dá)到了93.74%。
Research on highresolution remote sensing image segmentation model
劉姝妍,何 柳,陶 劍,卓雨東,王浩東
doi: 10.19358/j.issn.2097-1788.2023.10.002
高分辨率遙感影像往往蘊(yùn)含著豐富的地物信息、復(fù)雜的拓?fù)潢P(guān)系和多變的目標(biāo)對(duì)象,給復(fù)雜環(huán)境下情報(bào)識(shí)別與分析帶來了挑戰(zhàn)。為了高效、快速、精確地獲取到遙感圖像中的關(guān)鍵信息,在主流圖像分割的編碼-解碼模式的基礎(chǔ)上,提出了一種全新的遙感圖像分割方法,內(nèi)部引入了多種注意力機(jī)制以及多尺度的特征表示結(jié)構(gòu),增強(qiáng)了對(duì)遙感圖像的解譯能力,提升了最終的目標(biāo)分割效果。在公開數(shù)據(jù)集上的實(shí)驗(yàn)表明,所提方案可以在保持低參數(shù)量的情況下,明顯優(yōu)于其余基線方法。
Mixed preference analysis federated recommendation framework
宋雨倫,李大中,張絲雨,莊 媛,崔玲龍,王功舉,閆 龍
doi: 10.19358/j.issn.2097-1788.2023.10.003
針對(duì)基于內(nèi)容推薦算法存在過擬合及過度專業(yè)化問題,提出了一種混合個(gè)體及群體偏好分析的聯(lián)邦推薦框架,該框架包含三個(gè)模塊:基于隨機(jī)森林的偏好分析模塊、基于聯(lián)邦的相似興趣用戶分群模塊、基于混合偏好分析的推薦模塊。在基于隨機(jī)森林的偏好分析模塊中,提出考慮組合因素的同一屬性間偏好度分析和結(jié)合信息熵的不同屬性間在意度分析方法,通過糾正與真實(shí)興趣屬性具有強(qiáng)關(guān)聯(lián)性的非興趣屬性影響,初步解決了算法的過擬合問題;在基于聯(lián)邦的相似興趣用戶分群模塊和混合偏好分析的推薦模塊中,通過基于聯(lián)邦的相似興趣用戶分群模塊和群體的同屬性異屬性分析,得到用戶所在興趣群體的同屬性異屬性偏好信息,并通過網(wǎng)格遍歷群體和個(gè)體的超參權(quán)重混合進(jìn)行資源推薦,解決了推薦系統(tǒng)存在的過度專業(yè)化問題,提高算法在特定任務(wù)上的表現(xiàn)。實(shí)驗(yàn)結(jié)果表明所提算法相較于隨機(jī)森林算法在各方面指標(biāo)上有明顯提升,且提高了推薦系統(tǒng)的可解釋性。
Research on data management architecture and application based on metadata separation
周俊鵬,任德旺,倪 鑫,李麗娜,李亞暉,李運(yùn)喜
doi: 10.19358/j.issn.2097-1788.2023.10.004
針對(duì)現(xiàn)有嵌入式工業(yè)計(jì)算設(shè)備的數(shù)據(jù)分散、管理不足等問題,提出了一種基于元數(shù)據(jù)分離的數(shù)據(jù)管理體系結(jié)構(gòu)。融合數(shù)據(jù)特性需求,設(shè)計(jì)了一種數(shù)據(jù)統(tǒng)一標(biāo)準(zhǔn)化處理的規(guī)則庫,構(gòu)建了元數(shù)據(jù)信息組織模型、索引存儲(chǔ)結(jié)構(gòu)及標(biāo)準(zhǔn)格式的數(shù)據(jù)文件,實(shí)現(xiàn)了數(shù)據(jù)文件與元數(shù)據(jù)分離存儲(chǔ)的管理模式,將數(shù)據(jù)文件存儲(chǔ)至索引目錄磁盤,元數(shù)據(jù)信息實(shí)時(shí)寫入時(shí)序數(shù)據(jù)庫。初步開發(fā)了數(shù)據(jù)管理的應(yīng)用原型系統(tǒng),提升以元數(shù)據(jù)模型為基準(zhǔn)的數(shù)據(jù)分級(jí)組織管理能力,實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通,提高以業(yè)務(wù)為導(dǎo)向的數(shù)據(jù)管理應(yīng)用服務(wù)效能。
Research on the evaluation and analysis method of radar power range based on multisource data fusion
劉鎮(zhèn)瑜,林 歡,燕明亮,李詠晉,陳 磊
doi: 10.19358/j.issn.2097-1788.2023.10.005
傳統(tǒng)意義上,由于無法找到大量獨(dú)立同分布的樣本,雷達(dá)威力范圍評(píng)估分析是小樣本問題。從雷達(dá)威力范圍方程出發(fā),分析其中和雷達(dá)本身工作狀態(tài)、參數(shù)密切相關(guān)的個(gè)性因素,以及和雷達(dá)本身無關(guān)的目標(biāo)環(huán)境、氣象環(huán)境、操作使用等共性因素,對(duì)不同因素分別進(jìn)行處理,形成能夠關(guān)聯(lián)不同雷達(dá)測(cè)試數(shù)據(jù)的雷達(dá)威力范圍方程。分析整理歷史上目標(biāo)雷達(dá)截面積數(shù)據(jù),確定其分布規(guī)律;結(jié)合雷達(dá)測(cè)試數(shù)據(jù)分析共性因素的分布規(guī)律;確定雷達(dá)威力范圍的分布規(guī)律,給出雷達(dá)威力范圍的點(diǎn)估計(jì)和區(qū)間估計(jì)。經(jīng)過試驗(yàn)分析,所提方法與其他相關(guān)方法相比有較好的優(yōu)越性。
網(wǎng)絡(luò)與信息安全
Detection of malicious encrypted network traffic based on temporal and spatial principal component analysis
孟 楠,周成勝,趙 勛,王 斌,姜喬木
doi: 10.19358/j.issn.2097-1788.2023.10.006
惡意加密流量檢測(cè)對(duì)關(guān)鍵信息基礎(chǔ)設(shè)施的可靠運(yùn)行至關(guān)重要,也是應(yīng)對(duì)DDoS攻擊等網(wǎng)絡(luò)威脅的有效手段。利用時(shí)空主成分分析技術(shù),構(gòu)建了時(shí)間維度和空間維度的網(wǎng)絡(luò)流量變化模型,實(shí)現(xiàn)惡意加密流量的實(shí)時(shí)檢測(cè)和追蹤溯源。在時(shí)間維度,利用歷史積累的網(wǎng)絡(luò)流量監(jiān)測(cè)信息進(jìn)行主成分分析,構(gòu)建瞬時(shí)流量預(yù)測(cè)模型與實(shí)際監(jiān)測(cè)流量之間的平方預(yù)測(cè)誤差,判定網(wǎng)絡(luò)中出現(xiàn)惡意加密流量的時(shí)刻。在空間維度,利用歷史積累的各國家和地區(qū)的網(wǎng)絡(luò)流量監(jiān)測(cè)數(shù)據(jù),構(gòu)建區(qū)域流量預(yù)測(cè)模型與實(shí)際監(jiān)測(cè)流量之間的平方預(yù)測(cè)誤差,對(duì)惡意加密流量的來源地進(jìn)行追蹤溯源。最后,設(shè)計(jì)了一種可用于現(xiàn)網(wǎng)部署的算法實(shí)現(xiàn)流程,并分析了相比其他已有算法帶來的能力提升。
Research on blockchain access control methods based on policy and attribute hiding
楊志謀,文 強(qiáng),張 帥,張功國,孫 銳
doi: 10.19358/j.issn.2097-1788.2023.10.007
針對(duì)訪問控制過程中缺乏對(duì)用戶隱私保護(hù)的問題,提出了一種基于策略和屬性隱藏的區(qū)塊鏈訪問控制方案。首先,基于Hyperledger Fabric平臺(tái)編寫訪問請(qǐng)求、屬性管理和策略管理鏈碼,搭建基本的基于屬性的訪問控制模型,實(shí)現(xiàn)了細(xì)粒度的訪問控制。其次,使用AES對(duì)稱加密算法和屬性基加密算法將資源進(jìn)行加密存儲(chǔ),再將存儲(chǔ)地址和資源哈希上傳到區(qū)塊鏈上,確保數(shù)據(jù)的安全性和完整性。最后,使用Paillier同態(tài)加密算法將用戶屬性和訪問策略加密并上傳到區(qū)塊鏈上,確保訪問過程中用戶的隱私安全。通過方案對(duì)比和仿真實(shí)驗(yàn)說明了本文方案能夠有效保護(hù)用戶的隱私。
Design of a multi-to-multi electronic voting scheme based on homomorphism
霍珊珊,李艷俊,劉 健,羅昕銳
doi: 10.19358/j.issn.2097-1788.2023.10.008
電子投票方案通常基于安全多方計(jì)算、盲簽名、同態(tài)加密和秘密共享等密碼學(xué)技術(shù)設(shè)計(jì),并通過網(wǎng)絡(luò)實(shí)現(xiàn)。與傳統(tǒng)的投票方案相比,各個(gè)角色的隱私得到了更好的保護(hù),投票和計(jì)票過程更安全高效。基于Paillier密碼的同態(tài)性設(shè)計(jì)了多對(duì)多的電子投票方案,采用預(yù)計(jì)算三元組的方式在不解密選票的情形下對(duì)贊同、棄權(quán)、反對(duì)選項(xiàng)進(jìn)行合規(guī)性判斷;然后通過密碼同態(tài)性合成總投票、計(jì)票中心解密后便能夠從m個(gè)候選人中選出t個(gè)勝出者;最后證明了方案的正確性和安全性,并分析了方案實(shí)現(xiàn)需要的通信代價(jià)和投票人、可信中心以及計(jì)票員的計(jì)算量。方案整體實(shí)現(xiàn)效率高,適用于大型電子投票的場(chǎng)合。
數(shù)據(jù)治理
Research on interest measurement in competition law regulation of data capture behavior
聶 童
doi: 10.19358/j.issn.2097-1788.2023.10.009
數(shù)據(jù)是數(shù)字市場(chǎng)競(jìng)爭(zhēng)格局形成中的核心要素,然數(shù)據(jù)抓取作為獲得數(shù)據(jù)要素的重要手段卻備受爭(zhēng)議。數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,利益衡量這種古老的解釋方法,對(duì)于數(shù)據(jù)抓取行為的競(jìng)爭(zhēng)法規(guī)制仍然具有較強(qiáng)回應(yīng)性。從利益衡量的角度出發(fā),以平臺(tái)經(jīng)營者利益、消費(fèi)者利益及社會(huì)公共利益的多元利益維度展開,判斷其各方主體的利益沖突實(shí)質(zhì)和利益的屬性。利益衡量為數(shù)據(jù)抓取行為的競(jìng)爭(zhēng)法規(guī)制勘定邊界,亦為數(shù)據(jù)要素市場(chǎng)的建設(shè)提供價(jià)值序位考量,并暗含解決數(shù)據(jù)抓取行為這一復(fù)雜問題的指向,即建設(shè)統(tǒng)一的數(shù)據(jù)要素市場(chǎng)。
計(jì)算法學(xué)
Tort liability of companion AI platforms in the era of attention economy
唐 婧
doi: 10.19358/j.issn.2097-1788.2023.10.010
注意力經(jīng)濟(jì)背景下,傳統(tǒng)技術(shù)中立理論受到?jīng)_擊。在侵權(quán)責(zé)任規(guī)制上,應(yīng)為具有情感連接功能的陪伴式人工智能平臺(tái)找尋新的規(guī)制路徑。這一路徑不應(yīng)完全脫離當(dāng)前以過錯(cuò)責(zé)任為主的侵權(quán)責(zé)任體系,但由于陪伴式人工智能平臺(tái)的算法可能引發(fā)廣泛且嚴(yán)重的損害,因此在規(guī)制的整體態(tài)度上,保持相對(duì)嚴(yán)格的歸責(zé)傾向;而在具體的司法實(shí)踐中,以舉證責(zé)任倒置等方法補(bǔ)足直接運(yùn)用過錯(cuò)責(zé)任的缺陷,并對(duì)未來建立陪伴式人工智能平臺(tái)的通用規(guī)則持樂觀態(tài)度。
The exploration of trade secrets protection path of corporation data pool
胡浩翔
doi: 10.19358/j.issn.2097-1788.2023.10.011
“數(shù)據(jù)池”是數(shù)據(jù)生產(chǎn)要素的重要表現(xiàn)形式,對(duì)促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展、推動(dòng)產(chǎn)業(yè)轉(zhuǎn)型具有積極作用。但我國目前缺乏數(shù)據(jù)權(quán)利基礎(chǔ)制度,著作權(quán)法和數(shù)據(jù)共享協(xié)議都未能對(duì)數(shù)據(jù)池提供全面的法律保護(hù)。此種情況下,可以通過商業(yè)秘密相關(guān)法律規(guī)范對(duì)數(shù)據(jù)池予以保護(hù),但數(shù)據(jù)池必須滿足商業(yè)秘密的秘密性、價(jià)值性和保密措施構(gòu)成要件。在分析數(shù)據(jù)池秘密性構(gòu)成要件時(shí),應(yīng)當(dāng)重點(diǎn)認(rèn)識(shí)公開信息形成的新信息可以具有秘密性,企業(yè)間數(shù)據(jù)池共享的行為也不會(huì)使其喪失秘密性。
Unveiling the "algorithmic veil": reflection on building an algorithmic interpretation framework
劉 燁
doi: 10.19358/j.issn.2097-1788.2023.10.012
如何解決算法可解釋性問題是算法治理中的一個(gè)重要法律議題,囿于算法使用者與受眾之間不斷擴(kuò)大的“解釋鴻溝”,現(xiàn)階段算法解釋困境存在于算法運(yùn)行、決策形成到應(yīng)用的過程之中,具體體現(xiàn)在數(shù)據(jù)識(shí)別的失衡、證明依據(jù)的不足和損害結(jié)果的泛化三方面。考慮到不同算法運(yùn)用場(chǎng)域之下解釋需求的差異,借助體系思維構(gòu)建起算法解釋框架,或?qū)⒊蔀榻鉀Q可解釋性問題的突破口。以解釋對(duì)象為邏輯起點(diǎn)將解釋方法劃分為定向告知、公開披露和行政報(bào)備三種模式,并基于“場(chǎng)景公正”理念將其應(yīng)用于醫(yī)療、信息推薦、金融等領(lǐng)域,針對(duì)不同業(yè)務(wù)和場(chǎng)景區(qū)分可解釋性程度和標(biāo)準(zhǔn),以期實(shí)現(xiàn)算法可解釋。
行業(yè)應(yīng)用
Research on data security sharing technology of the legal inspection department based on blockchain
湯雪珂,蔡全旺,汪慧君
doi: 10.19358/j.issn.2097-1788.2023.10.013
針對(duì)法院、檢察院和司法行政機(jī)關(guān)等單位傳遞與共享案件數(shù)據(jù)過程中面臨的身份偽冒、監(jiān)管困難、隱私泄露和數(shù)據(jù)濫用等安全風(fēng)險(xiǎn),提出一種基于區(qū)塊鏈技術(shù)的法檢司數(shù)據(jù)安全共享模型。通過模擬實(shí)驗(yàn),驗(yàn)證了模型的可行性,并且對(duì)基于區(qū)塊鏈的法檢司數(shù)據(jù)安全共享涉及的混合加密技術(shù)、可信計(jì)算技術(shù)、數(shù)據(jù)共享管控智能合約以及基于區(qū)塊鏈的跨域身份認(rèn)證技術(shù)進(jìn)行了闡述,以期提升數(shù)據(jù)資源共享環(huán)節(jié)的安全防護(hù)能力。
Research on the application of road zero trust security based on dual mode single packet authorization
陳 瑜,殷 浩,姚 蕾,馮 鼎,管浩杰,嚴(yán) 浩
doi: 10.19358/j.issn.2097-1788.2023.10.014
針對(duì)交通信息系統(tǒng)工程具有接入范圍復(fù)雜、網(wǎng)絡(luò)安全風(fēng)險(xiǎn)大的特點(diǎn),提出了公路全面零信任系統(tǒng)架構(gòu)。該架構(gòu)主要由網(wǎng)關(guān)管理平臺(tái)、可信身份管控平臺(tái)等6個(gè)平臺(tái)組成。重點(diǎn)研究了基于網(wǎng)關(guān)管理平臺(tái)的安全交互過程,一是實(shí)現(xiàn)多物理環(huán)境下自動(dòng)路由策略;二是研究雙模SPA敲門機(jī)制,重點(diǎn)分析UDP認(rèn)證和TCP敲門數(shù)據(jù)訪問。依托智慧農(nóng)路系統(tǒng)工程,評(píng)估了應(yīng)用前后安全訪問的效果和效率。研究結(jié)果表明,公路零信任系統(tǒng)可在國產(chǎn)芯片Loongson3A4000上運(yùn)行;雙模單包授權(quán)SPA技術(shù)在UDP SPA基礎(chǔ)上拓展了TCP SPA能力,比單模SPA訪問速率快50%;在滿足三級(jí)等保控制點(diǎn)的基礎(chǔ)上可實(shí)現(xiàn)網(wǎng)絡(luò)隱身。