Kullanılabilirlik ve Kullanılabilirlik Testi İstatistikleri

Yazar

Selin Bulba

Kullanılabilirlik

Bu İçerikte Yer Alan Ana Başlıklar:

• Kullanılabilirlik Nedir?

• Kullanılabilirlik, Test ile Nasıl Ölçümlenir?

• Ölçümlenen İstatistikler

• Algılanan İstatistikler

• Kullanılabilirlik Metrikleri

‍

Bu içerik ile; kullanılabilirliğin ne olduğunu, kullanılabilirliğin hangi yapı üzerinden tanımlandığını ve bir ürünün ya da hizmetin ne kadar kullanıcı dostu olduğunu tespit etmenin yöntemlerini öğreneceksiniz.

‍

Userspots'tan kullanılabilirlik testi & uzman analizi servisleri alarak ürününüzün kullanılabilirlik ölçümlerini öğrenebilir ayrıca Userspots Akademi'de online olarak devam eden; Tasarımcılar İçin Veri Eğitimi'ne katılarak "kullanılabilirlik istatistikleri" çalışmasını uygulamalı olarak deneyimleyebilirsiniz.

Kullanılabilirlik Nedir?

‍

‍

Kullanılabilirlik, “Kullanıcı Deneyimi” kavramı popüler olana kadar bu alan için kullanılan ilk kavramdı. Görev tanımında UX'in yer aldığı ilk insan Don Norman sonradan, UX yani Kullanıcı Deneyimi kavramını hayatımıza dahil etti. Kullanılabilirlik aslında istatiksel bir temele dayanıyor ve bir ürünün kullanılabilirliği istatistiksel veriler aracılığıyla bizi tasarımla buluşturuyor.

‍

Gelin biraz tanım yapalım, kullanılabilirliğin genel tanımı nedir?

Bir ürünün potansiyel kullanıcıları tarafından, belirli bir kullanım bağlamı içinde amaçlanan hedeflerine ulaşmak için etkin, verimli ve tatmin edici bir şekilde kullanılabilmesi.

Aslında 3 önemli parçadan oluşan bu tanımı örnekler üzerinden detaylandıralım:

‍

Potansiyel Kullanıcı: Bir ürünü satın alan kişi ile kullanan kişi her zaman aynı olmayabilir. Örneğin bir eve ADSL Modem alınacak, evdeki çocuk internetin en yoğun kullanıcısı olacak diyelim. Burada satın alma işlemini anne ya da baba gerçekleştirecek. Bu noktada ürünü gidip anne/babaya test ettirmek çok da doğru bir hareket olmayabilir. Varsayalım, belki de anne veya baba bu ürünü hayatlarında hiç kullanmayabilirler. Bu nedenle bu ürünü kimin kullanacağı, hedef kitlesini yani potansiyel kullanıcılarını belirleme noktasında ve de kullanılabilirliğin tanımında oldukça önemli bir yere sahip.

‍

Kullanım Bağlamı: Ürün nerede kullanılacak? Örneğin bir ATM ise ürününüz onu sokakta test etmelisiniz, mesela sokaktaki konumunda ekrana yansıyan güneş ışınları bir kriter olacak. Ürününüz bir mobil uygulama ise ve onun ne kadar kolay kullanılabilir olduğunu test edecekseniz kullanıcının günlük hareketleri ve konumları kullanım bağlamını oluşturur. Sokakta yürürken, evde otururken, yatarken vb noktalarda mobil cihazın taşınabilirliği bu ürünün kullanılabilirliğini ve de kullanım bağlamını tamamen değiştiriyor.

‍

Kullanım Hedefleri: Bu işin istatistiki tarafı. Bir banka uygulaması düşünelim; para transferi yapmak, kredi kartı bakiyesini kontrol etmek, kredi kartı borcunu ödemek, fatura ödemek ya da fatura için otomatik ödeme talimatı vermek gibi işlemler bu uygulamanın kullanım hedeflerini oluşturur. Bu hedefleri bir de kullanılabilirlik testi üzerinden ele alalım. Potansiyel kullanıcıyı bir bankanın mobil uygulaması için teste davet ettik, ev sahibine ait olduğunu varsaydığımız IBAN numarası vererek kendisinden bu hesaba her ay için 2000 TL kira ödemesini otomatik ödeme şeklinde aktarmasını istiyoruz. Sonrasında kullanıcı tamamen kendi başına hareket ederek, verdiğimiz bu senaryoyu tamamlamak için gerekli adımları uygulamaya başlıyor. Böylece ürüne yönelik bir kullanım hedefi oluşturmuş oluyoruz.

‍

Oluşturduğumuz bu son derece basit ve standart sayabileceğimiz kullanım hedefini, kullanıcı, yardım almadan kendi kendine yaptığında ne kadar başarılı oluyor/ne kadar hata yapıyor, ne kadar süre ve efor harcıyor bilgileri bize ölçümlenen istatistikleri verirken işlemin ne kadar kolay olduğunu düşünüyor noktasındaki bilgiler de algılanan istatistikleri veriyor.

‍

Kullanılabilirlik, Test ile Nasıl Ölçümlenir?

‍

‍

Kullanılabilirlik Testi’nin temelden detaya ne olduğunu, ne işe yaradığını “Kullanılabilirlik Testi Nedir?” adlı içeriğimizde, testin hazırlık ve uygulama aşamalarını, tüm bunların nasıl yapıldığını ise “Kullanılabilirlik Testi Nasıl Yapılır?” adlı rehber içeriğimizde anlatmıştık.

Burada ise kullanılabilirliği istatistiksel boyutuyla ele alıp testlerin bize bu anlamda neler sağladığı konusundan bahsedeceğiz.

‍

Kullanılabilirlik testleri, ürünlerde bulunan kullanılabilirlik hatalarını bulmak ve düzeltmek için veri toplamaya dayanıyor. Bu testleri ürünü son kullanıcılarının yardımı ile değerlendirmek için kullanıyoruz. Bir testin öncesinde kullanıcıya yönelik sorular sorduğumuz, sonrasında ise ürün ile ilgili deneyimine yönelik sorduğumuz sorulardan oluşan anketler yapıyoruz. Testin senaryosunun tamamlanması ya da yarıda bırakılmasına bağlı olarak da ulaşmak istediğimiz bilgileri anketler aracılığıyla almış oluyoruz.

‍

Katılımcılar senaryoyu uygularken kullanılabilirliğin tanımını yaparken de bahsettiğimiz 2 tane ölçümlenen 1 tane de algılanan istatistiği topluyoruz:

‍

‍

Ölçümlenen İstatistikler

‍

a. Etkililik: Senaryo başarı oranı ve hata sayıları bize etkililiği veriyor. Burada şunlara dikkat etmemiz gerekiyor: Teste katılan kişilerden kaçı o senaryoda yardım almadan başarılı oldu? ve Teste katılan kişiler o senaryoda kaç hata yaptılar?

b. Verimlilik: Senaryonun ne kadar sürede tamamlandığı bizi kullanılabilirliğin verimliliğine ulaştırıyor. Yani burada şunun yanıtına ihtiyacımız var; Teste katılan kişiler o senaryoda başarılı olmak için ne kadar vakit harcadılar?

Algılanan İstatistikler

‍

a. Memnuniyet: Kullanılabilirlik testindeki katılımcının, test ettiğimiz ürün ve sürece dair memnuniyetini bilmeye ihtiyacımız var. Bu bilgiye ulaşabilmemiz için senaryo tamamlandıktan sonra katılımcıya bir anket sunuyoruz. Direkt “bu senaryodan ve kullanımdan ne kadar memnun kaldın?” diye sorup yorumlarını alabileceğimiz gibi az sayıda sorulardan oluşan farklı anket tiplerini de kullanabiliyoruz. UX araştırmalarımızda kullandığımız farklı anket tiplerini incelemek için Measuring U’nun içeriğini ziyaret edebilirsiniz.

Kullanılabilirlik Metrikleri

‍

Peki ne gibi istatistikleri toplayabiliyoruz? Birlikte bakalım:

‍

1. Basit Metrikler

‍En temelde toplayabildiğimiz basit istatistiklerdir. Sayacak olursak:

‍
• Senaryo tamamlama oranı
• Senaryo sırası sayfa ziyareti
• Senaryo memnuniyeti
• Test memnuniyeti
• Karşılaşılan Problemler, bizi bu temel istatistiklere ulaştıran verilerdir.

‍

Bu verileri ise şu şekilde görselleştirebiliriz:

‍

Satırların katılımcıları, sütunların ise test sürecinde yaşanan problemleri temsil ediyor. Hangi katılımcının hangi problemlerle karşılaştığını bu gibi görselleştirmelerle derlediğimizde basit istatistikleri çok daha net bir şekilde görme fırsatı yaratmış oluruz. Bu görselde örneğin ilk üç problemin (teste göre ne olduklarını belirleyebiliriz) çok sık yaşandığını, çoğunluğun aynı hataya düştüğünü gözlemlemek mümkün.

2. SUM (Single Usability Metric)

Bir görev ya da sistemin kullanılabilirliğini kolaylaştıran dört temel parametrenin ortalama tek bir istatistikle gösterilmesidir.

‍

• Ortalama Görev Zamanı

• Görev Tamamlama Oranı

• Ortalama Hata Sayısı

• Görev Sonrası Memnuniyet

‍

‍

SUM; (Etkililiği; ortalama görev zamanı, Verimliliği; görev tamamlama oranı ve ortalama hata sayısı, Memnuniyeti ise görev sonrası memnuniyet olarak aldığımızda) bu 3 ana veriyi istatistiki bir işlemden geçirerek bize yüzdelik bir sonuç veriyor. Örneğin; x fonksiyonunun kullanılabilirlik kolaylığı metriği 65/100.

‍

Rekabet içinde olan ürünün veya değişikliklerin zaman içindeki kullanılabilirlik değişimlerini karşılaştırmanızda oldukça faydalı bir metriktir. Farklı ölçeklerdeki birçok değerin ölçümünü değerlendirip hangi ürünün/görevin kullanılabilirlik açısından daha üstün olduğunu detaylandırmanızda yardımcı olur ve SUM’u tamamen excel üzerinde gerçekleştirebilirsiniz.

‍

Userspots olarak bir GSM şirketinin arayüz tasarımını değiştirmesi üzerine öncesi ve sonrasının kullanım kolaylığını karşılaştırmaları adına bir SUM testi hazırladık. Video versiyonunu izleyebilirsiniz.

‍

Gelelim videomuzun sonlarında da karşınıza çıkan diğer metriklere...

‍

Her test sonrası kullanıcılara sorduğumuz biçimlendirilmiş sorulardan oluşan anketlerimiz var ve bu soru forumları bize kullanıcıların sistem hakkındaki genel kullanım kolaylığına dair görüşlerini ölçmemizi sağlıyor. Kullanıcının görüş ve yorumları test öncesi-sonrasında oldukça farklılık gösterebilir.

Test sonrasında genel deneyimleri rakamsal olarak ölçebilmek için uygulayabileceğimiz 3 farklı anket çeşidi mevcut:

• SUS

• QUIS

• SUPR-Q

‍

Bu 3 anketin ve diğer çeşitlerin içeriklerine kısaca göz atmak isterseniz “Kullanılabilirlik Testi Ölçekleri” adlı rehber yazımızı okuyabilirsiniz.
‍

Peki bu 3’lü bizi istatistik konusunda hangi noktalara götürüyor?

SUS (System Usability Score): Özellikle online olarak istatistiki veri toplamak istediğimizde en etkili yoldur. Bütün deneyimi 10 soru ile ölçer ve bunun %50’si olumlu %50’si olumsuz sorulardır. Dilerseniz katılımcı dilerseniz de segment odaklı inceleme yaparak gelen puanları değerlendirebilirsiniz. Belirli bir problemi vurgulayamaz ama arayüzün kullanılabilirliğinin genel olarak ne derece iyi ya da kötü olduğuna dair fikir verir. Müşterileri kıyaslamak için değil kullanıcı bazında “Niye düşük vermiş?” ya da “Yüksek verme sebebi marka sadakati mi?” gibi sorularınıza yanıt verir.

‍

‍

Jakob Nielsen’ın SUS ile ilgili görüşlerini incelemek isterseniz aşağıdaki videoya göz atabilirsiniz.

‍

SUPR-Q (Standardized User Experience Percentile Rank Questionnaire): SUS’un soru sayısı farklılaşmış ve içine NPS (Net Promosyoncu Puanı) eklenmiş hali. Burada verilen 8 soru birleşerek; kullanılabilirlik, güvenilirlik, bağlılık ve görünüm olmak üzere 4 kategoriye ait birer skora ulaştırıyor sizi. SUPR-Q analizini yine excel’de yapabiliyorsunuz ama orada elde ettiğiniz sonuçla benchmark yapmak isterseniz ücret ödemeniz gerekiyor.

‍

‍

‍

QUIS (Questionnaire for User Interface Satisfaction): İnsan bilgisayar etkileşiminde kullanıcının memnuniyetini çeşitli açılardan incelemek üzerine tasarlanmıştır. 27 sorudan oluşan ve kullanılabilirlik testindeki neredeyse her aşamayla ilgili soru sorulan bir anket. 27 sorunun aslında ilk 6’sı temel değerlendirmeden, kalan 21’i ise ekran görünürlülüğü, sistem bilgilendirmesi ve terminoloji, öğrenebilirlik, sistem kapasitesi ile ilgili sorulardan oluşuyor. Buradan aldığımız istatistiklere (ortalama skor) eklediğimiz standart sapmalar sayesinde ise üst ve alt limit verilere ulaşıyoruz. Böylece web site ile ilgili genel düşüncelerin puanlamasını tespit ediyor ve değerlendirebiliyoruz. SUPR-Q ya da SUS’tan birini kullandığınızda yanına ek olarak QUIS’i ekleyebilirsiniz. Böylece -örneğin- arayüzünüzün kullanılabilirliğinin globaldeki konumunu tespit ederken, arayüzün içerisindeki çeşitli kullanım kolaylığı detayları ile ilgili verilere de ulaşabilirsiniz.

QUIS’le ilgili unutmamanız gerekenler:

• Arayüzle ilgili belirli faktörlere ilişkin kullanıcı memnuniyetini daha net olarak belirlemizi ve bu alanları iyileştirmemizi sağlar.

• Herhangi bir yüzde vermez, globalde karşılaştırma imkanı sunmaz.

‍

**Kendi yaptığımız bir tool ile gerçekleştirdiğimiz QUIS çalışması örneği**

‍

Tüm bunlara ek olarak bir kullanıcı arayüzündeki kullanılabilirlik sorunlarını tespit etmek için “Sezgisel Analiz” inceleme yöntemini de uygulamanız faydalı olacaktır.

Kullanılabilirliği ve nasıl ölçümlendiğini, örnekler üzerinden de konuştuğumuz “It Depends” videomuzu izlemeden ayrılmayın :)