500 MİLYAR SÖZCÜK

Google fazla gürültü koparmadan, yaklaşık 5,2 milyar kitaptan devşirilmiş dev bir dijital veri tabanı oluşturmuş. (Ben “veri tabanı” nedir onu bile bilmem). Bu dijital depo, 1500 yılından başlayarak 2008 yılına kadar yayımlanmış İngilizce, Fransızca, İspanyolca, Almanca, Çince ve Rusça kitaplarda kullanılmış 500 milyar sözcük içeriyormuş.
Bilgisayarı olan ve merak eden herkes bu klasöre (“500 Billion Words”) girip herhangi bir sözcüğün belli yıllar arasında kaç kez kullanıldığını araştırabiliyormuş. (Ben de Google’a girdim böyle bir klasör gerçekten var.) Tek sözcük olması gerekmiyor, en fazla 5 sözcükten oluşan bir sözcük grubu da olabiliyormuş. (Bunu denemedim.)
***
Bir “tık” ile, örneğin “kadın” sözcüğünün 1970’lere kadar “erkek” sözcüğü ile karşılaştırılamayacak kadar az kullanıldığını, 1970’ten, feminist hareketin tutunmasından sonra kullanımda büyük bir artış görüldüğü saptanabilirmiş. Ayrıca Mickey Mouse ile Marilyn Monroe’nun basında Jimmy Carter kadar ilgi görmediği de görülebilirmiş.
Harvard Üniversitesi’nden Erez Lieberman Aiden, “Amaç, 8 yaşında bir çocuğu, tarihteki kültürel eğilimleri, kitaplarda kayda geçmiş biçimiyle araştırma olanağına kavuşturmak” diyormuş.
Bu dijital veri tabanının bizim dil, kültür anlayışımızı, düşüncelerin dolaşımıyla bilgilerimizi büyük oranda değiştirebileceği söyleniyormuş.
***
“Miş”, “muş” diye yazıyorum, çünkü bu bilgileri bana bizim Tan Bey gönderdi. Kendi kanser araştırma laboratuvarından, kurmakta olduğu Kök Hücre Enstitüsü’nden vakit bulup resim ve sörf yapar, kitap okur, bir de böyle gıncıfırlı işlerle uğraşır.
Evet, bizim Tanbey tutmuş Türk, Türkiye, Türkçe sözcük grubu ile üç anlama gelen Osmanlı (Otoman) sözcüklerini araştırmış. Bulduğu sonuca çok şaşırmış.
Örneğin: 1920’de aynı düzeyde (yüzde 0.00050) olan Türk ve Osmanlı sözcükleri 1950’ye kadar birlikte düşüş göstermişler. Ama Osmanlı daha az düşüş göstermiş. Derken, Osmanlı sözcüğü 1950’dan sonra 2000 yılına kadar hızla yükselirken (yüzde 0.00100) Türk sözcüğü yüzde 0.00020’ye kadar düşmüş
“Türkiye” 1920-1925 arasında yüzde 0.00200’den 2000 yılına kadar yüzde 0.00120’ye doğru gerilerken, Osmanlı aynı dönemde yüzde 0.00050’den 0.00100’e doğru yükselmiş.
“Türkçe” 1920-1925 yılları arasında yüzde 0.00190 iken 2000 yılına kadar 0.00115 olmuş. “Osmanlıca” ise aynı dönemde yüzde 0.00040’tan 0.00080’e yükselmiş.
***
80 yıllık grafiği görmek çok etkileyici. 80 yıl içinde Osmanlı, Osmanlı Devleti, Osmanlıca sözcükleri ilerliyor. Buna karşın Türk, Türkçe, Türkiye sözcükleri geriliyor.
Tan Bey “Sence neden böyle oluyor?” diye soruyor. “Bunun anlamı ne? Acaba bütün dünya Osmanlıyı mı özlüyor, yoksa Türk, Türkçe, Türkiye sözcüklerini hiç duymayacağı günlerin özlemini mi çekiyor.”
Zor bir soru? Siz ne dersiniz?