Tarmoq paketi brokerida ma'lumotlarni maskalash texnologiyasi va yechimi nima?

1. Ma'lumotlarni maskalash tushunchasi

Ma'lumotlarni maskalash, shuningdek, ma'lumotlarni maskalash sifatida ham tanilgan. Bu uyali telefon raqami, bank kartasi raqami va boshqa maʼlumotlar kabi maxfiy maʼlumotlarni konvertatsiya qilish, oʻzgartirish yoki qoplashning texnik usulidir. Ushbu usul, birinchi navbatda, ishonchli bo'lmagan muhitda nozik ma'lumotlarning bevosita ishlatilishini oldini olish uchun ishlatiladi.

Ma'lumotlarni niqoblash printsipi: Ma'lumotlarni niqoblash keyingi ishlab chiqish, sinovdan o'tkazish va ma'lumotlarni tahlil qilish maskalash ta'sir qilmasligini ta'minlash uchun asl ma'lumotlar xususiyatlarini, biznes qoidalarini va ma'lumotlarning dolzarbligini saqlashi kerak. Maskalashdan oldin va keyin ma'lumotlarning mustahkamligi va haqiqiyligini ta'minlang.

2. Ma'lumotlarni maskalash tasnifi

Ma'lumotlarni maskalash statik ma'lumotlarni maskalash (SDM) va dinamik ma'lumotlarni maskalash (DDM) ga bo'linishi mumkin.

Statik ma'lumotlarni maskalash (SDM): Statik ma'lumotlarni maskalash ishlab chiqarish muhitidan izolyatsiya qilish uchun yangi ishlab chiqarish bo'lmagan muhit ma'lumotlar bazasini yaratishni talab qiladi. Nozik ma'lumotlar ishlab chiqarish ma'lumotlar bazasidan olinadi va keyin ishlab chiqarishdan tashqari ma'lumotlar bazasida saqlanadi. Shunday qilib, desensitizatsiyalangan ma'lumotlar ishlab chiqarish muhitidan ajratiladi, bu biznes ehtiyojlarini qondiradi va ishlab chiqarish ma'lumotlarining xavfsizligini ta'minlaydi.

SDM

Dinamik ma'lumotlarni maskalash (DDM): Odatda ishlab chiqarish muhitida real vaqtda nozik ma'lumotlarni desensitizatsiya qilish uchun ishlatiladi. Ba'zan, turli vaziyatlarda bir xil nozik ma'lumotlarni o'qish uchun turli darajadagi niqoblash talab qilinadi. Masalan, turli rollar va ruxsatlar turli niqoblash sxemalarini amalga oshirishi mumkin.

DDM

Ma'lumotlar hisoboti va ma'lumotlar mahsulotlarini maskalash ilovasi

Bunday stsenariylar asosan ichki ma'lumotlarni monitoring qilish mahsulotlari yoki reklama taxtasi, tashqi xizmat ma'lumotlari mahsulotlari va biznes hisobotlari va loyihalarni ko'rib chiqish kabi ma'lumotlar tahliliga asoslangan hisobotlarni o'z ichiga oladi.

ma'lumotlar hisoboti mahsulot niqoblash

3. Ma'lumotlarni maskalash yechimi

Umumiy ma'lumotlarni maskalash sxemalariga quyidagilar kiradi: bekor qilish, tasodifiy qiymat, ma'lumotlarni almashtirish, simmetrik shifrlash, o'rtacha qiymat, ofset va yaxlitlash va boshqalar.

Bekor qilish: Bekor qilish maxfiy ma'lumotlarni shifrlash, kesish yoki yashirishni anglatadi. Ushbu sxema odatda haqiqiy ma'lumotlarni maxsus belgilar bilan almashtiradi (masalan, *). Amaliyot oddiy, lekin foydalanuvchilar asl ma'lumotlarning formatini bila olmaydi, bu keyingi ma'lumotlar ilovalariga ta'sir qilishi mumkin.

Tasodifiy qiymat: Tasodifiy qiymat nozik ma'lumotlarni tasodifiy almashtirishni bildiradi (raqamlar raqamlar o'rnini, harflar harflar va belgilar belgilar o'rnini egallaydi). Ushbu niqoblash usuli ma'lum darajada nozik ma'lumotlarning formatini ta'minlaydi va keyingi ma'lumotlarni qo'llashni osonlashtiradi. Ba'zi ma'noli so'zlar, masalan, odamlar va joylar nomlari uchun niqoblash lug'atlari kerak bo'lishi mumkin.

Ma'lumotlarni almashtirish: Ma'lumotlarni almashtirish null va tasodifiy qiymatlarni maskalashga o'xshaydi, faqat maxsus belgilar yoki tasodifiy qiymatlarni ishlatish o'rniga, maskalanuvchi ma'lumotlar ma'lum bir qiymat bilan almashtiriladi.

Simmetrik shifrlash: Simmetrik shifrlash maxsus qaytariladigan niqoblash usulidir. U maxfiy ma'lumotlarni shifrlash kalitlari va algoritmlari orqali shifrlaydi. Shifrlangan matn formati mantiqiy qoidalardagi dastlabki ma'lumotlarga mos keladi.

O'rtacha: O'rtacha sxema ko'pincha statistik stsenariylarda qo'llaniladi. Raqamli ma'lumotlar uchun biz birinchi navbatda ularning o'rtacha qiymatini hisoblaymiz, so'ngra desensitizatsiyalangan qiymatlarni o'rtacha qiymat atrofida tasodifiy taqsimlaymiz, shu bilan ma'lumotlar yig'indisini doimiy ushlab turamiz.

Ofset va yaxlitlash: Bu usul raqamli ma'lumotlarni tasodifiy siljish orqali o'zgartiradi. Ofset yaxlitlash diapazonning taxminiy haqiqiyligini ta'minlaydi, ma'lumotlarning xavfsizligini ta'minlaydi, bu avvalgi sxemalarga qaraganda haqiqiy ma'lumotlarga yaqinroq va katta ma'lumotlarni tahlil qilish stsenariysida katta ahamiyatga ega.

ML-NPB-5660

Tavsiya etilgan model"ML-NPB-5660"Ma'lumotlarni niqoblash uchun

4. Ko'p qo'llaniladigan ma'lumotlarni maskalash usullari

(1). Statistik usullar

Ma'lumotlardan namuna olish va ma'lumotlarni yig'ish

- Ma'lumotlardan namuna olish: Ma'lumotlar to'plamining vakili kichik to'plamini tanlash orqali dastlabki ma'lumotlar to'plamini tahlil qilish va baholash de-identifikatsiya qilish texnikasi samaradorligini oshirishning muhim usuli hisoblanadi.

- Ma'lumotlarni yig'ish: Mikroma'lumotlardagi atributlarga qo'llaniladigan statistik usullar (masalan, yig'ish, hisoblash, o'rtacha, maksimal va minimal) to'plami sifatida, natija dastlabki ma'lumotlar to'plamidagi barcha yozuvlarni aks ettiradi.

(2). Kriptografiya

Kriptografiya desensibilizatsiya qilish yoki uning samaradorligini oshirishning keng tarqalgan usuli hisoblanadi. Har xil turdagi shifrlash algoritmlari turli desensitizatsiya effektlariga erishishi mumkin.

- Deterministik shifrlash: tasodifiy bo'lmagan simmetrik shifrlash. Odatda identifikator ma'lumotlarini qayta ishlaydi va kerak bo'lganda shifrlangan matnni asl identifikatorga qayta tiklashi mumkin, ammo kalit to'g'ri himoyalangan bo'lishi kerak.

- Qaytarib bo'lmaydigan shifrlash: Xesh funktsiyasi ma'lumotlarni qayta ishlash uchun ishlatiladi, bu odatda ID ma'lumotlari uchun ishlatiladi. Uni to'g'ridan-to'g'ri dekodlash mumkin emas va xaritalash aloqasi saqlanishi kerak. Bundan tashqari, hash funksiyasining xususiyati tufayli ma'lumotlar to'qnashuvi sodir bo'lishi mumkin.

- Gomomorfik shifrlash: shifrlangan matnning gomomorfik algoritmidan foydalaniladi. Uning xarakteristikasi shundaki, shifrlangan matn bilan ishlash natijasi shifrni ochishdan keyingi ochiq matn bilan bir xil bo'ladi. Shuning uchun u odatda raqamli maydonlarni qayta ishlash uchun ishlatiladi, lekin u ishlash sabablari uchun keng qo'llanilmaydi.

(3). Tizim texnologiyasi

Bostirish texnologiyasi maxfiylik himoyasiga javob bermaydigan ma'lumotlar elementlarini o'chiradi yoki himoya qiladi, lekin ularni nashr qilmaydi.

- Maskalash: bu atribut qiymatini maskalash uchun eng keng tarqalgan desensitizatsiya usuliga ishora qiladi, masalan, raqib raqami, ID karta yulduzcha bilan belgilangan yoki manzil kesilgan.

- Mahalliy bostirish: ma'lum atribut qiymatlarini (ustunlarni) o'chirish, muhim bo'lmagan ma'lumotlar maydonlarini olib tashlash jarayonini anglatadi;

- Yozuvni bostirish: muayyan yozuvlarni (qatorlarni) o'chirish, muhim bo'lmagan ma'lumotlar yozuvlarini o'chirish jarayonini anglatadi.

(4). Texnologiya taxallusi

Pseudomanning - to'g'ridan-to'g'ri identifikatorni (yoki boshqa sezgir identifikatorni) almashtirish uchun taxallusdan foydalanadigan de-identifikatsiya usuli. Taxallus texnikasi to'g'ridan-to'g'ri yoki sezgir identifikatorlar o'rniga har bir alohida ma'lumot sub'ekti uchun noyob identifikatorlarni yaratadi.

- Asl identifikatorga mos keladigan tasodifiy qiymatlarni mustaqil ravishda yaratishi, xaritalash jadvalini saqlashi va xaritalash jadvaliga kirishni qat'iy nazorat qilishi mumkin.

- Siz taxalluslarni ishlab chiqarish uchun shifrlashdan ham foydalanishingiz mumkin, lekin parolni ochish kalitini to'g'ri saqlashingiz kerak;

Ushbu texnologiya ochiq platforma stsenariysidagi OpenID kabi ko'p sonli mustaqil ma'lumotlar foydalanuvchilari uchun keng qo'llaniladi, bu erda turli ishlab chiquvchilar bir xil foydalanuvchi uchun turli xil Openidlarni oladi.

(5). Umumlashtirish texnikasi

Umumlashtirish texnikasi ma'lumotlar to'plamidagi tanlangan atributlarning granularligini kamaytiradigan va ma'lumotlarning yanada umumiy va mavhum tavsifini ta'minlaydigan identifikatsiyadan chiqarish usulini anglatadi. Umumlashtirish texnologiyasini amalga oshirish oson va rekord darajadagi ma'lumotlarning haqiqiyligini himoya qilishi mumkin. U odatda ma'lumotlar mahsulotlari yoki ma'lumotlar hisobotlarida qo'llaniladi.

- Yaxlitlash: tanlangan atribut uchun yaxlitlash bazasini tanlashni o'z ichiga oladi, masalan, yuqoriga yoki pastga kriminalistika, 100, 500, 1K va 10K natijalarni beradi

- Yuqori va pastki kodlash texnikasi: Eshikdan yuqoridagi (yoki pastdagi) qiymatlarni yuqori (yoki pastki) darajani ifodalovchi chegara bilan almashtiring, natijada “X dan yuqori” yoki “X pastda” natijaga erishing.

(6). Randomizatsiya usullari

De-identifikatsiya texnikasining bir turi sifatida, randomizatsiya texnologiyasi tasodifiylashtirish orqali atribut qiymatini o'zgartirishni nazarda tutadi, shuning uchun randomizatsiyadan keyingi qiymat asl haqiqiy qiymatdan farq qiladi. Ushbu jarayon tajovuzkorning bir xil ma'lumotlar yozuvidagi boshqa atribut qiymatlaridan atribut qiymatini olish qobiliyatini pasaytiradi, lekin ishlab chiqarish sinovi ma'lumotlari bilan umumiy bo'lgan natijada olingan ma'lumotlarning haqiqiyligiga ta'sir qiladi.


Yuborilgan vaqt: 27-sentyabr-2022