SAĞLIK VERİLERİNDE ANONİMİZASYON VE MODEL ÖNERİSİ


Naralan A.

III. Uluslararası Bilişim Kongresi, Batman, Türkiye, 2 - 04 Mayıs 2024, ss.108-116

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Basıldığı Şehir: Batman
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.108-116
  • Recep Tayyip Erdoğan Üniversitesi Adresli: Evet

Özet

Sağlık kurumları tarafından hasta bireylere ait verilerin toplanması ve bu verilere erişim bilgi
teknolojilerinin gelişmesi ile kolaylaşmıştır. Sağlık personelinin bu verilere geçmişe doğru erişimleri
kişi sağlığı bakımından gerekli olduğundan tüm yaşamı boyunca ve yaşamından bir süre sonra da
tutulmaya devam edilmektedir. Kişinin yaşamı boyunca birçok kez sağlık kurumlarından aldığı
hizmetler ile de elde edilen kişisel verilerin büyüklüğü artmaktadır. Sağlık kurumlarının hizmet verdiği
kişi sayısı dikkate alındığında bu veriler hız, çeşitlilik ve büyüklük gibi bileşenler itibarıyla büyük veri
sınıfına girmektedir. Bu veriler kişiyi tanımlayan bilgiler ile birlikte tutulduğundan mahremiyet
açısından güvenli bir şekilde saklanmalıdır. Bununla birlikte sağlık bilimleri veya diğer bilimsel
araştırmalar için bu veriler üzerinde çalışmalar yapmak gerekmektedir. Bu çalışmalar esnasında
mahremiyet korunmalı ve verilerden kişiye ulaşabilmek mümkün olmamalıdır. Mahremiyet koruması,
veriler çeşitli teknikler ile bulanıklaştırılarak sağlanır. Anonimleştirme olarak adlandırılan
bulanıklaştırma esnasında bazı değerli veriler kısmen de olsa orijinalliğini kaybetmekte istenen sonuca
daha az katkı sunmaktadır. Anonimleştirme için kullanılan yöntemlerinin birbirlerine göre farklı güçlü
ve zayıf yönleri vardır. Sağlık verileri, veri sorumluları tarafından sürekli anonimleştirilerek hazır
tutulan veriler değildir. Ayrıca belirli bir durum için kullanılması gereken üzerinde uzlaşılmış bir
anonimleştirme genellemesi de yapmak mümkün değildir. Bu çalışmada Talebe Bağlı Amaca Yönelik
Anonimleştirme olarak adlandırılan model önerisinde bulunulmuştur. Önerilen modele göre sağlık
verileri üzerinde analiz yapacak olan araştırmacıların veri yöneticileri ve veri sorumluları ile birlikte
çalışarak kişisel mahremiyeti korumadan taviz vermeden en az veri kaybı ile amaca yönelik olarak bir
veya daha fazla anonimleştirme yöntemini kullanabilmeleri istenen sonuca ulaşmak için daha etkin
olacağı belirtilmiştir.

The collection of data on sick individuals by health institutions and access to these collected
data has become easier with the development of information technologies. Since it is necessary for
health personnel to have access to these data retrospectively for healthcare personnel, these data
continue to be kept throughout the person's life and for a while after his or her life. The size of personal
data obtained by the services a person receives from health institutions many times throughout his life
increases. Considering the number of people served by health institutions, these data fall into the big
data category in terms of components such as speed, diversity and size. Since this data is kept together
with information that identifies the person, it must be stored securely for privacy. However, it is
necessary to conduct studies on these data for health sciences or other scientific research. During these
studies, confidentiality must be protected and it should not be possible to reach the person through this
data. Privacy protection is provided by blurring data with various techniques. During blurring, also
known as anonymization, some valuable data loses its originality, at least partially, and contributes less
to the desired result. The methods used for anonymization have different strengths and weaknesses
109
compared to each other. Health data is not constantly anonymized and kept ready by data controllers.
Moreover, it is not possible to make an agreed upon generalization of anonymization that should be
used for a particular situation. In this study, a model called Demand-Based Purpose-Driven
Anonymization has been proposed. According to the proposed model, it has been stated that researchers
analyzing health data would be more effective in achieving the desired outcome, towards to the purpose,
with minimal data loss and without compromising personal privacy, by collaborating with data
managers and data controllers to employ one or more anonymization methods.