Blogların arama ve keşfini geliştirmek için taksonomi ve ontoloji kullanma
Daha geniş bir kitleye ulaşmanın zorluklarından biri, potansiyel okuyucuların aynı şeyi bulmak için çeşitli kelimeler kullanabilmeleridir. Taksonomi ve ontoloji kullanan anlamsal işleme teknikleri, okuyucu sayısını artırmaya veya insanların bloglardaki ilgili bilgileri daha verimli bulmasını kolaylaştırabilecek zengin meta veriler yaratmaya yardımcı olur. WordPress platformunda, içerik için etiket ve etiket yapmayı kolaylaştıran özel taksonomi özellikleri için kullanılan bir eklentiye sahiptir. Ancak daha zengin semantik işleme tekniklerinin kullanımı, dahili olarak veya Wand Inc., Alchemy API ve SAS enstitüleri gibi şirketlerden bulutlarda kullanılabilen çeşitli araçlardan edinilebilir.
Alchemyapi’nin CEO’su ve kurucusu Elliot Turner, akademik ortam dışındaki kişilerin “taksonomi” ve “ontoloji” terimlerini ayırt etme ve bunları dönüşümlü olarak kullanma eğiliminde olduğunu belirtiyor. Ama açıkladı: “Gerçek şu ki oldukça farklı. Taksonomi, topikal alanları hiyerarşik yapı boyunca giderek daha ayrıntılı bir şekilde böler. Ontoloji daha geniş bir perspektif sunabilir, aksiyomları, kuralları ve diğer birçok bilgi türünü birleştirebilir. Sonunda, yayıncılar içeriği topikal hiyerarşiye yönetmek için taksonomi ve ontoloji kullanıyor, bu da insanların kendileri için önemli bilgiler bulmayı daha kolay bulmalarını sağlıyor. ”
Taksonomi, Wand, Inc.’deki COO Mark Neck’in ontolojisini tamamlar, taksonomi ve ontoloji benzerdir, çünkü her ikisi de bilgi düzenlemek için kullanılan bazı topikal alanlardaki kavramların bir koleksiyonudur. Her ikisi de bilgileri yönetmek için bir veri modeli olarak düşünülebilir. Taksonomi daha basit bir modeldir. Ontoloji daha karmaşık bir modeldir. ” Taksonomi, daha geniş veya daha dar bir kavram olarak bağlanan bir kavramla bir ağaç olarak düzenlenir. Örneğin, mobilya taksonomisi, “yatak odası mobilyaları”, “yataklar” ve “komodinler” den daha dar bir terim (veya çocuk terimi) olacaktır. “Yatak”, “kollardan” daha fazla çocuk terimi alacak. Lehrer, ontolojinin daha geniş ve daha dar bir ilişkinin çok ötesinde kavramlar arasındaki ilişkiden daha karmaşık modellemeye izin verdiğini söyledi. Taksonomi bir ağaçsa, en iyi ontoloji bir ağ olarak temsil edilir. Örneğin, “komodinler” “meşe” ile bir ilişkisi olabilir “ve” çekmeceden “bir” “Nightstounds” ile ilişkinin bir parçası olabilir. Her iki durumda da, aynı kavramın bağlı olmasını sağlamak için bir eşanlamlı olması yaygındır. Örneğin, “Dizüstü Bilgisayar” ın “Dizüstü Bilgisayar” dan eşanlamlı vardır. Web sitelerinde gezinmek için araştırılabilecek yapılar sağlamak gibi daha basit ihtiyaçlar için mükemmel bir taksonomi. Örneğin, Amazon ürün sayfalarını yönetmek için taksonomi kullanıyor, dedi Lehrer. Analitik veya cevap sorularına girmek istediğinizde ontoloji daha önemlidir. Lehrer, kullanıcıların web sitesinde satın alınacak bir komodin bulmasına yardımcı olmak istiyorsanız mobilya taksonomisi çok iyi olacak. Mobilya ontolojisi çok iyi olacaktır. İlk taksonomi web sitesi menüsünün gezinmesini artırabilir. Çoğu menü navigasyonu geniş bir konseptle başlayacak ve daha sonra kullanıcıların daha spesifik kavramları keşfetmelerine izin verecektir.
Lehrer, taksonomi yapılandırılmamış içerikten anahtar kelimeler aramasını desteklemek için de kullanılabilir. Bir kullanıcı istedikleri her şey için anahtar kelimeler arayabilir ve bir dizi sonuç alabilir. Daha sonra, sol tarafta, kullanıcıların taksonomideki kavramlara dayalı bir sonuç koleksiyonunu daraltmasına/filtrelemelerini sağlamak için taksonomi terimi (içeriği işaretlenmiş olan) sunulabilir. Lehrer, “Bu, arama motorlarının alaka düzeyini artırmak için kullanılacak iyi bir ek araç.” Dedi.
Tersine, ontoloji daha sofistike bir arama sorgusunu etkinleştirmek için daha sık kullanılır. Örneğin, Google’ın “16. Başkan Kimdir?” Abraham Lincoln’un görüntüleri ve kısa biyografisini gösteriyor. Bu, web sitesinin sonucu değildir ve bu sorunun doğrudan bir cevabıdır. “Bu tür arama sonuçlarının arka planda ontoloji ile desteklenmesi muhtemeldir,” diye açıkladı Lehrer. Taksonomi ve ontoloji uygulandığında, açıklanan blog içeriğini, web sitelerini ve portalları tanımlamak ve kategorize etmek için yapılandırılmamış metin verilerini taradılar. McNeill, SAS Enstitüsü Analitik Analitik Pazarlama Yöneticisi. Araçlar temel olarak taksonomide bir kavramın var olup olmadığını veya ontolojik ilişkilerin var olup olmadığını belirtir. Beyanname, bloglar, web siteleri veya diğer metin içeriği türleri hakkında yeni bir meta veri oluşturur – arama ve alma rutinine dahil edilebilen yeni etiketler sağlar. McNeil, “Bu tür meta veriler, içerikle hızlı bir şekilde birleşmek ve yazarın niyetlerini tanımlamak için dezavantajlı olmak için çok yararlıdır. Örneğin, ‘Jaguar’ terimini bir araç ve hayvan olarak ayırt etmek. Bu ek meta veriler, son kullanıcı için Wikipedia bilgi kutusuna benzer şekilde temsil edilebilir.
Ayrıca, içerik yeni türev meta verilerden (içeriğin kendisine göre) anlaşılmaktadır ve bu zenginleştirilmiş dizinli etiket/meta veri koleksiyonunda yapılan sorgular daha iyi ve daha alakalı sonuçları teşvik etmektedir. ” Etiketleri kullanarak etiketlerin ötesinde, bloglar aracılığıyla alakalı içeriği bulma yeteneğini büyük ölçüde basitleştirebilir, ancak etiket sayısındaki artışla birlikte onu korumak zordur. Bu, hassasiyetlerini sınırlar ve blog içeriğinin derinliğine ulaşır. Turner Alchemyapi, anahtar kelimenin bilgileri yönetmede yardımcı programlar sağladığını, ancak bazı ana sınırlamaları olduğunu açıkladı. Yani, aynı konuyu (örneğin, “köpekler”, “köpekler”, “köpekler”, vb. ). Anahtar kelimelere dayanan yazılım sistemleri, bu kelimelerin her birini farklı bir konu olarak görürken, taksonomi veya ontolojik bilgileri kullanan bir sistem bu farklı kelimeleri aynı konuya (“köpek”) zayıflatabilir. Taksonomi ve ontoloji, “basketbol” ve “futbol” gibi doğrudan aynı olmayan konular arasındaki benzerliklerin belirlenmesine yardımcı olabilir. Bu kelimelerin her biri farklı aktivitelere (basketbol ve futbol) atıfta bulunurken, her ikisi de taksonomi veya ontoloji tarafından sağlanan bilgi hiyerarşisinde yakalanacak olan spor ilişkisinin türüne atıfta bulunur.
Bu fikir bir aile ağacına benzer.Oldukça uzağa geri çekilirsek, hepimizin bir şekilde ilişki kurduğunu görürüz.Aynı benzetme, içeriğin nasıl etiketlendiği için geçerlidir.Bir ağaçta yürürseniz, bağlı terimini bulacaksınız.Turner, bu kavramların blogların yapışkanlığını ve katılımını arttırmak için çok önemli olduğunu söyledi.”Web sitelerini yayınlamanın amacı, yerinde (yapışkan) ve içerik ve reklamlara katılımdır.Yayıncılar, sitede tutan ilginç içerik önererek okuyucularla olan ilişkilerini derinleştirmek ve daha fazla sayfa (ve daha fazla reklam) görmelerini sağlamak istiyorlar.
Sonunda, yayıncı uzun süredir devam eden anahtar kelimeyi veya alıcının satın alma işlemine yaklaştıklarında kullanılma eğiliminde olduğu daha spesifik bir ifadeyi araştırdığında, yüzey seviyesinin etiketlerinin ne yapabileceğinin ötesinde taksonomiyi ve ontolojiyi görüyoruz. ” Büyük ölçekli yayıncıların karşılaştığı ana zorluklardan biri, hepsi içerik üreten yüzlerce veya binlerce yazar, tüm bu makalelerde nasıl önemli öneriler ve çapraz navigasyon sağlanır? Bir yaklaşım, yazarı belirli etiketler verme politikasına uymaya zorlamaktır. Turner, bu tür politikaların standartların çok fazla eğitimi ve geliştirilmesi gerektirdiğini ve böyle bir sürecin açık yayıncılık platformları için yapılamayacağını söyledi. “Daha iyi bir yaklaşımın, farklı yazarlar tarafından biraz farklı bir şekilde ifade edilen fikirlerle kamuya açık bağlantıları bulmak için kategoriyi otomatik olarak” geliştirmek “için taksonomiyi kullanmak olduğunu açıkladı. Bu, yayıncıların site envanterlerine daha derin dalış yapmalarını ve okuyucuları çekecek yüksek hedefli içerik çekmelerini sağlar. Buna karşılık, bu zaman zaman orada olan içeriğin değerini artırır. Makale ilk yayınlandığında ve ardından keskin bir düşüş izlediğinde doğrudan faiz zirvesi yerine, bir makaleden elde edilen geliri artıran daha uzun bir içerik ömrü görüyoruz. ”
Taksonomi için araçları kullanmak, insanlar topikal alanlardan hiyerarşik temsiller oluşturmak için manuel olarak çalıştıklarında mevcuttur. Sık değişmeyen konulara sahip bazı özel alanlarda, bu süreç başarılı olabilir. Ancak çoğu endüstride, konular genellikle değişir ve insanlar tarafından izlenmeye devam edemez. Turner, “Alchemyapi veya sinaptica gibi otomatik araçlara doğru hareket eden şirketlerde insan müdahalesi olmadan hızlı bir şekilde taksonomi yapabilen büyük bir değişiklik gördük.” Birçok taksonominin standartları genellikle reklam odasında içeriğin nasıl temsil edildiğine odaklanmıştır. Örneğin, İnternet reklam bürolarının kalite güvencesi için taksonomi yönergeleri, çeşitli tarafların işaretlerini ve veri alışverişini etkili bir şekilde normalleştirmelerini sağlayan genel yapılardır. Google reklamları gibi standart olmayan yöntemler, aramayı optimize etmeye güvenen içerik yöneticileri tarafından yaygın olarak benimsenmiştir. makineler ve organik arama. İnternet içeriği sağlayıcıları ayrıca Wand’dan Lehrer, semantik web verilerini, Owl, RDF ve SKO’ları temsil etmek için web standartlarını kullanmaya başlıyor. Bloglar ve web siteleri, Sinaptica, SmartLogic Semaphore, Uzman Sistemler ve Poolparty dahil olmak üzere taksonomiyi ve ontolojiyi yönetmek için çeşitli araçlar kullandığını gördü. Lehrer, “Bazı metin madenciliği araçlarının iyi taksonomi yönetimi var, ancak birçok durumda şirkete madencilik veya analitik araçlara ontoloji yayınlayabilecek bağımsız bir ontoloji yönetim aracı var.”
Taksonomi Zorlukları Zorluklardan biri, SAS Institute’tan McNeill, bu araçtaki birçok aracın verimli bir şekilde kullanılabilmesi için metin verilerinde eğitilmesi gerektiğidir. Bu sorunun üstesinden gelmek için SAS, ilk anlamsal ilişkiyi bulmak için makine öğrenme tekniklerini uygulamak için benzersiz bir yöntem geliştirdi ve daha sonra kategorileri ve kavramları tanımlamaya yardımcı olmak için kullandı. McNeill, “Tarihsel engeller, bunları veriler hakkında eğitme veya metin modelinin oluşturulduğu bir dizi eğitim yapmak için belge örneklerini manuel olarak sınıflandırma ihtiyacıdır. Bununla birlikte, SAS bağlamsal analizi ile bu alanda SAS tarafından yapılan ilerleme bu tarihi gereksinimi hafifletmektedir. Bu, aynı yazılım arayüzünde doğrudan dilsel kurallarla geliştirilen acemi taksonomi geliştirmek için metin madenciliğinin kullanılmasına izin verir. SAS Text Miner ayrıca analistlerin nadir eğitim ile başlayabileceği aktif öğrenme yöntemleri sağlar, ancak her bir gelişme ile modelleri öğreten alaka düzeyi geri bildirimleri yoluyla modellerini geliştirebilirler. Bir diğer zorluk da, madencilik metni sırasında ilginç bilgiler elde etmek için gereken karmaşıklığı yaratma ihtiyacını dengelemektir. Karmaşık ontolojinin bilgileri madencilik yapmak daha iyi olduğunu, daha basit bir taksonomi ağacının bilgi sunmak için daha iyi olduğunu açıkladı.
Yani, bir denge bulmak zor. ” Taksonomi ve ontoloji, Alchemyapi’den Turner kelimesini yaratanların önyargısını, dünya görüşünü ve deneyimlerini yansıtabilir. “İçerik veya makaleler, bir bölgede alakalı ancak diğer bölgelerde olmayan hobileri veya sporları tartışıyorsa, yanlış sonuçlar veya sonuçlar almayacaksınız.” Taksonomi ve ontoloji de yenilikle ilgili zorluklarla karşı karşıyadır. Turner, “fikirler, memler, kelimeler ve yeni içerik her gün yapılıyor ve uzun işaretleme yöntemleri yeni terimleri yakalayamayabilir veya doğru bir şekilde sinyal vermeyebilir. Sonunda, bir sistemin ilişkileri tanıması ve okuyucu için makul bir ilgili kategoriye yerleştirmesi ve bu dinamik değişikliklere yanıt vermek için zamanla büyümesi gerekir. ” Bu zorluğun yükünü hafifletmek ve büyük ölçekli içeriği kategorize etmek için daha iyi hazırlanmış makinelere güvenirken insanların rehberlik sağlamasını sağlamak için otomatik çözüme hareket. Örneğin, insanlar tarafından yapılan taksonomiyi gören bir grup mühendis, “Kral Leon” un “müzik” veya “grup” yerine “büyüteç ve dünya lideri” olarak kategorize edildiğini keşfetti. Taksonomi, “Leon Kralları” hakkındaki metni otomatik olarak okuyacak ve zaman zaman bunu müzikle ilgili bir kategoriye girmenin gerekli olduğunu anlayacak, ancak bu özel taksonomiyi inşa eden insanlar grubu hiç duymamış ve dolayısıyla yanlış sınıflandırılmış .