1. Ma'lumotlarni niqoblash tushunchasi
Ma'lumotlarni niqoblash, shuningdek, ma'lumotlarni niqoblash sifatida ham tanilgan. Bu niqoblash qoidalari va siyosatlarini berganimizda, mobil telefon raqami, bank karta raqami va boshqa ma'lumotlar kabi maxfiy ma'lumotlarni o'zgartirish, o'zgartirish yoki yashirishning texnik usulidir. Ushbu usul asosan maxfiy ma'lumotlarning ishonchsiz muhitda to'g'ridan-to'g'ri ishlatilishining oldini olish uchun ishlatiladi.
Ma'lumotlarni niqoblash tamoyili: Ma'lumotlarni niqoblash asl ma'lumotlar xususiyatlarini, biznes qoidalarini va ma'lumotlarning dolzarbligini saqlab qolishi kerak, bu keyingi ishlab chiqish, sinovdan o'tkazish va ma'lumotlarni tahlil qilish jarayoniga niqoblash ta'sir qilmasligini ta'minlaydi. Maskalashdan oldin va keyin ma'lumotlarning izchilligi va haqiqiyligini ta'minlang.
2. Ma'lumotlarni niqoblash tasnifi
Ma'lumotlarni niqoblashni statik ma'lumotlarni niqoblash (SDM) va dinamik ma'lumotlarni niqoblash (DDM) ga bo'lish mumkin.
Statik ma'lumotlarni niqoblash (SDM)Statik ma'lumotlarni niqoblash ishlab chiqarish muhitidan ajratish uchun yangi ishlab chiqarish bo'lmagan muhit ma'lumotlar bazasini yaratishni talab qiladi. Maxfiy ma'lumotlar ishlab chiqarish ma'lumotlar bazasidan olinadi va keyin ishlab chiqarish bo'lmagan ma'lumotlar bazasida saqlanadi. Shu tarzda, sezgirligi pasaytirilgan ma'lumotlar ishlab chiqarish muhitidan ajratiladi, bu esa biznes ehtiyojlarini qondiradi va ishlab chiqarish ma'lumotlarining xavfsizligini ta'minlaydi.
Dinamik ma'lumotlarni niqoblash (DDM)Odatda ishlab chiqarish muhitida real vaqt rejimida sezgir ma'lumotlarni desensitizatsiya qilish uchun ishlatiladi. Ba'zan, turli vaziyatlarda bir xil sezgir ma'lumotlarni o'qish uchun turli darajadagi niqoblash talab qilinadi. Masalan, turli rollar va ruxsatnomalar turli xil niqoblash sxemalarini amalga oshirishi mumkin.
Ma'lumotlar hisoboti va ma'lumotlar mahsulotlarini niqoblash ilovasi
Bunday stsenariylarga asosan ichki ma'lumotlarni monitoring qilish mahsulotlari yoki reklama taxtalari, tashqi xizmat ma'lumotlari mahsulotlari va biznes hisobotlari va loyihalarni ko'rib chiqish kabi ma'lumotlar tahliliga asoslangan hisobotlar kiradi.
3. Ma'lumotlarni niqoblash yechimi
Ma'lumotlarni niqoblashning keng tarqalgan sxemalariga quyidagilar kiradi: bekor qilish, tasodifiy qiymat, ma'lumotlarni almashtirish, simmetrik shifrlash, o'rtacha qiymat, ofset va yaxlitlash va boshqalar.
Noto'g'ri deb e'lon qilishNoto'g'ri ma'lumotlar shifrlash, qisqartirish yoki maxfiy ma'lumotlarni yashirishni anglatadi. Ushbu sxema odatda haqiqiy ma'lumotlarni maxsus belgilar (masalan, *) bilan almashtiradi. Amaliyot oddiy, ammo foydalanuvchilar asl ma'lumotlarning formatini bila olmaydilar, bu esa keyingi ma'lumotlar ilovalariga ta'sir qilishi mumkin.
Tasodifiy qiymatTasodifiy qiymat maxfiy ma'lumotlarning tasodifiy almashtirilishini anglatadi (raqamlar raqamlarni, harflar harflarni va belgilar belgilarni almashtiradi). Ushbu niqoblash usuli ma'lum darajada maxfiy ma'lumotlarning formatlanishini ta'minlaydi va keyinchalik ma'lumotlarni qo'llashni osonlashtiradi. Odamlar va joylarning nomlari kabi ba'zi mazmunli so'zlar uchun niqoblash lug'atlari kerak bo'lishi mumkin.
Ma'lumotlarni almashtirishMa'lumotlarni almashtirish nol va tasodifiy qiymatlarni niqoblashga o'xshaydi, faqat maxsus belgilar yoki tasodifiy qiymatlardan foydalanish o'rniga niqoblangan ma'lumotlar ma'lum bir qiymat bilan almashtiriladi.
Simmetrik shifrlashSimmetrik shifrlash - bu maxsus qaytariladigan niqoblash usuli. U maxfiy ma'lumotlarni shifrlash kalitlari va algoritmlari orqali shifrlaydi. Shifrlangan matn formati mantiqiy qoidalardagi asl ma'lumotlarga mos keladi.
O'rtachaO'rtacha sxema ko'pincha statistik stsenariylarda qo'llaniladi. Raqamli ma'lumotlar uchun biz avval ularning o'rtacha qiymatini hisoblaymiz, so'ngra sezgirligi pasaygan qiymatlarni o'rtacha qiymat atrofida tasodifiy taqsimlaymiz, shu bilan ma'lumotlar yig'indisini doimiy saqlaymiz.
Ofset va yaxlitlashBu usul raqamli ma'lumotlarni tasodifiy siljish orqali o'zgartiradi. Ofset yaxlitlash ma'lumotlar xavfsizligini saqlab qolish bilan birga diapazonning taxminiy haqiqiyligini ta'minlaydi, bu avvalgi sxemalarga qaraganda haqiqiy ma'lumotlarga yaqinroq va katta ma'lumotlarni tahlil qilish stsenariysida katta ahamiyatga ega.
Tavsiya etilgan model "ML-NPB-5660"Ma'lumotlarni niqoblash uchun
4. Ma'lumotlarni niqoblashning keng tarqalgan usullari
(1). Statistik usullar
Ma'lumotlarni namunalash va ma'lumotlarni yig'ish
- Ma'lumotlar namunalarini olish: Ma'lumotlar to'plamining vakillik qiluvchi kichik to'plamini tanlash orqali asl ma'lumotlar to'plamini tahlil qilish va baholash deidentifikatsiya usullarining samaradorligini oshirishning muhim usuli hisoblanadi.
- Ma'lumotlarni agregatsiyalash: Mikroma'lumotlardagi atributlarga qo'llaniladigan statistik usullar (masalan, yig'ish, sanash, o'rtacha qiymat, maksimal va minimal qiymatlar) to'plami sifatida natija asl ma'lumotlar to'plamidagi barcha yozuvlarni aks ettiradi.
(2). Kriptografiya
Kriptografiya desensitizatsiya samaradorligini oshirish yoki kamaytirishning keng tarqalgan usuli hisoblanadi. Turli xil shifrlash algoritmlari turli xil desensitizatsiya effektlariga erishishi mumkin.
- Deterministik shifrlash: Tasodifiy bo'lmagan simmetrik shifrlash. Odatda u identifikatsiya ma'lumotlarini qayta ishlaydi va kerak bo'lganda shifrlangan matnni asl identifikatorga qayta tiklashi va shifrlashi mumkin, ammo kalit to'g'ri himoyalangan bo'lishi kerak.
- Qaytarib bo'lmaydigan shifrlash: Xesh funksiyasi ma'lumotlarni qayta ishlash uchun ishlatiladi, odatda identifikatsiya ma'lumotlari uchun ishlatiladi. Uni to'g'ridan-to'g'ri shifrdan chiqarib bo'lmaydi va xaritalash aloqasi saqlanishi kerak. Bundan tashqari, xesh funksiyasining xususiyati tufayli ma'lumotlar to'qnashuvi yuz berishi mumkin.
- Gomomorfik shifrlash: Shifrlangan matnli gomomorfik algoritm qo'llaniladi. Uning xususiyati shundaki, shifrlangan matn operatsiyasining natijasi shifrni ochishdan keyin oddiy matn operatsiyasining natijasi bilan bir xil bo'ladi. Shuning uchun u odatda raqamli maydonlarni qayta ishlash uchun ishlatiladi, ammo ishlash sabablari tufayli keng qo'llanilmaydi.
(3). Tizim texnologiyasi
Bostirish texnologiyasi maxfiylik himoyasiga javob bermaydigan ma'lumotlar elementlarini o'chiradi yoki himoya qiladi, lekin ularni nashr qilmaydi.
- Niqoblash: bu raqib raqami, shaxsni tasdiqlovchi hujjat yulduzcha bilan belgilangan yoki manzil qisqartirilgan kabi atribut qiymatini niqoblashning eng keng tarqalgan desensitizatsiya usulini anglatadi.
- Mahalliy bostirish: ma'lum atribut qiymatlarini (ustunlarni) o'chirish, keraksiz ma'lumotlar maydonlarini olib tashlash jarayonini anglatadi;
- Yozuvlarni bostirish: muayyan yozuvlarni (qatorlarni) o'chirish, keraksiz ma'lumotlar yozuvlarini o'chirish jarayonini anglatadi.
(4). Taxallus texnologiyasi
Taxallus - bu to'g'ridan-to'g'ri identifikatorni (yoki boshqa sezgir identifikatorni) almashtirish uchun taxallusdan foydalanadigan deidentifikatsiya texnikasi. Taxallus texnikasi to'g'ridan-to'g'ri yoki sezgir identifikatorlar o'rniga har bir alohida axborot sub'ekti uchun noyob identifikatorlarni yaratadi.
- U asl identifikatorga mos kelish uchun mustaqil ravishda tasodifiy qiymatlarni yaratishi, xaritalash jadvalini saqlashi va xaritalash jadvaliga kirishni qat'iy nazorat qilishi mumkin.
- Shuningdek, taxalluslarni yaratish uchun shifrlashdan foydalanishingiz mumkin, ammo shifrni ochish kalitini to'g'ri saqlashingiz kerak;
Ushbu texnologiya ko'p sonli mustaqil ma'lumotlar foydalanuvchilari, masalan, ochiq platforma stsenariysida OpenID holatlarida keng qo'llaniladi, bunda turli ishlab chiquvchilar bir xil foydalanuvchi uchun turli xil Openidlarni olishadi.
(5). Umumlashtirish usullari
Umumlashtirish texnikasi ma'lumotlar to'plamidagi tanlangan atributlarning aniqligini kamaytiradigan va ma'lumotlarning umumiyroq va mavhumroq tavsifini taqdim etadigan de-identifikatsiya texnikasini anglatadi. Umumlashtirish texnologiyasini amalga oshirish oson va yozuv darajasidagi ma'lumotlarning haqiqiyligini himoya qilishi mumkin. U odatda ma'lumotlar mahsulotlarida yoki ma'lumotlar hisobotlarida qo'llaniladi.
- Yaxlitlash: tanlangan atribut uchun yaxlitlash bazasini tanlashni o'z ichiga oladi, masalan, yuqoriga yoki pastga qarab sud ekspertizasi, bu esa 100, 500, 1K va 10K natijalarini beradi.
- Yuqori va pastki kodlash texnikasi: Chegaradan yuqori (yoki past) qiymatlarni yuqori (yoki pastki) darajani ifodalovchi chegara bilan almashtiring, natijada "X dan yuqori" yoki "X dan past" natijasini oling.
(6). Tasodifiy usullar
Identifikatsiyani yo'qotish texnikasining bir turi sifatida, tasodifiylashtirish texnologiyasi tasodifiylashtirish orqali atribut qiymatini o'zgartirishni anglatadi, shunda tasodifiylashtirishdan keyingi qiymat asl haqiqiy qiymatdan farq qiladi. Bu jarayon tajovuzkorning bir xil ma'lumotlar yozuvidagi boshqa atribut qiymatlaridan atribut qiymatini olish qobiliyatini kamaytiradi, ammo natijada olingan ma'lumotlarning haqiqiyligiga ta'sir qiladi, bu ishlab chiqarish sinov ma'lumotlarida keng tarqalgan.
Nashr vaqti: 2022-yil 27-sentabr



