- 19 Eki 2014
- 350
- 0
Boyutsallığın laneti, günlük yaşantının üç boyutlu fiziksel alanı gibi düşük boyutlu ortamlarda oluşmayan yüksek boyutlu alanlarda (genellikle yüzlerce veya binlerce boyutta) verileri analiz ederken ve organize ederken ortaya çıkan çeşitli fenomenlere işaret etmektir. Bu deyim, dinamik optimizasyon problemlerini düşündüğünde Richard E. Bellman tarafından ortaya atılmıştır.
Çeşitli alanlarda örneğin sayısal analiz, örnekleme, kombinasyon, makine öğrenmesi, veri madenciliği ve veri tabanları gibi bu isim ile anılan birden fazla olgu vardır. Bu sorunların ortak teması, boyutluluk arttıkça, alanın hacmi o kadar hızlı artmakta ki mevcut veriler seyrekleşecektir. Bu seyreklik istatistiksel önemi olan herhangi bir yöntem için sorunludur. İstatistiksel olarak sağlam ve güvenilir bir sonuç elde etmek için, sonucu desteklemek için gereken veri miktarı genellikle boyutsallıkla katlanarak büyür. Ayrıca, verileri organize etmek ve araştırmak çoğunlukla nesnelerin benzer özelliklere sahip grupları oluşturduğu alanları tespit etmeye dayanır, ancak yüksek boyutlu verilerde, tüm nesneler yaygın veri organizasyonu stratejilerinin etkin olmasını engelleyen birçok yönden seyrek ve benzer olmamış gibi görünür.
Kaynak :
https://en.wikipedia.org/wiki/Curse_of_dimensionality