Yeni Google Chrome uzantısı, resimlerdeki metni kopyalayıp silmenizi sağlar

Anonim

Yeni Google Chrome uzantısı, resimlerdeki metni kopyalayıp silmenizi sağlar

Bilgisayarlar

Stu Robarts

25 Nisan 2014

Project Naptha adında yeni bir Chrome uzantısı, kullanıcıların resimlerden metin kopyalayıp silmesine izin verir

Web’deki resimlere gömülü metinlerin erişilemediği genellikle kabul edildi. Görüntüler tek bir katman olarak oluşturulduğundan, bu yalnızca olduğu gibi ... ya da Google Chrome için Project Naptha adlı yeni bir uzantı, kullanıcıların görüntülerin içindeki metni vurgulayıp kopyalamasına olanak tanıdığı için.

Söylenecek ilk şey, bu işlevin başka bir yerde mevcut olmasıdır. Microsoft OneNote, Google Drive ve Google Street View gibi belirli yazılım parçaları, resimler içindeki metni tanımlamak için optik karakter tanıma (OCR) kullanır.

Öte yandan, Project Naptha, Microsoft Research tarafından geliştirilen Stroke Width Transform (SWT) yöntemini kullanır. Kullanılabilen açık kaynaklı OCR algoritmalarıyla tatmin olmadığından, geliştirici Kevin Kwok bir çözüm bulmaya çalışırken zaman harcadı. Gizmag'a haftalarca mektupları "cryptogram bulmacaları " olarak görerek ve gelişmiş bir dil modeliyle metni tanıdığını ve daha fazla hafta "bir çeşit kaba kuvvet metin tanıyıcı oluşturmaya çalışacağını" söyledi.

Sonuçta, SWT kullanmaya karar verdi. Bu yaklaşım, metnin bir işaretleyicisi olarak önceden belirlenmiş ayrı özellikleri tespit etmeye çalışmak yerine, harfleri potansiyel olarak metin olabilecek öğeleri tanımlamanın bir yolu olarak oluşturan çizgilerin genişliğini kullanır. Bu, OCR'ye göre belirli avantajlar sağlar.

"[İnme Genişliği Dönüşümü], metin bölgelerini bir dil-tanıma biçiminde tanımlayabilmektedir, " diyor Kwok. "Bir insanın yapabildiği gibi bir anlamda, bir işaretin hangi dilde yazıldığını bilmeden yazılı bir dil taşıdığını, bunun ne anlama geldiğini boşver."

SWT, aynı zamanda, fotoğraflarda açılı metin ve metinleri de algılayabilir ve aslında gerçekten de bunun için tasarlandı. Bu, metnin metinlerin, basılı metnin veya Web'den ekran görüntülerinin taranmasında sınırlı olmadığı anlamına gelir; bu metinlerde, metinlerin bilgisayar tarafından üretilenlere daha aşina olma eğiliminde olduğu ve dolayısıyla daha kolay seçilmeleri mümkün olur.

Kwok Gizmag'a, Proje Naptha'nın başlangıçta MIT'deki bir hackathonun parçası olarak çalıştığı bir şey olduğunu açıklıyor (burada 2. sırada). "Resimlerdeki metnin seçilmesi, teknik seviyede oldukça uygun bir şeydi; yani, var olması gereken teknoloji var ve bunu biraz zaman aldı, " diye açıklıyor. "Ama bir tür açıklanamaz bir nedenden ötürü, daha önce hiç yapılmamıştı. Diğer her şey, transkripsiyon, çeviri, metin silme ve modifikasyonlar, sadece bir tür işe yaramaz, bir parçadan sonra bariz ve önemsiz bir ekleme olarak geldi. fikir başarıldı. "

Kwok, taramalar, metin içeren fotoğraflar, etiketli şemalar, ekran görüntüleri ve metin bindirmeleri de dahil olmak üzere Project Naptha'nın kullanılabileceği bir dizi örnek kaynak sağlar. Ayrıca, metin bindirmelerinin görüntülerden silinmesini ve geri çevrilen görüntülerin yanı sıra çevrilecek görüntüler içindeki vurgulanmış metinleri de gösterir. Kullanıcı için sorunsuz bir deneyim sağlamak amacıyla, Naptha imlecin hareketini izler ve konum ve hızına göre sürekli olarak ikinci bir ivme verir, böylece kullanıcının bir görüntüden seçim yapmak isteyebileceği olası bir metni işlemeye başlayabilir.

Kwok, Project Naptha'daki işlevselliğin çoğunun iyileştirilmesi gerektiğini ve zamanla, metin tanıma, çeviri ve silme işlemlerinin daha da geliştirilebileceğini ileri sürüyor (aslında şu anda başlattığı gerekçenin bir tweet olduğunu söylüyor. Google ile sahip olduğu bazı kredilerin tükendi. Bununla birlikte, temel işlevsellik çok kullanılabilir ve daha ileri teknoloji için potansiyel heyecan verici.

"Ben, Naptha'nın sağladığı gerçek değer, farkında olduğum kadarıyla, benzeri görülmemiş bir deneyim. " Diyorlar. "Onun çeşitli alt bileşenleri ve algoritmaları açısından, muhtemelen sanatın arkasında birkaç yıl ve heyecan verici şeylerden biri bir ekip araştırma ve tüketici kullanımı arasındaki bu uçurumu köprüleme olasılığı olabilir. "

Merak ediyor olsaydınız, Naptha ismi, hafif yakıtlarda naptha adı verilen bir maddenin kullanılmasından ve yüksek aydınlatma metninden kaynaklanır.

Project Naptha hakkında daha fazla bilgi edinebilir ve test sürüşünü Project Naptha web sitesinde bir demo olarak bulabilirsiniz.

Chrome uzantısı: Proje Naptha

Project Naptha adında yeni bir Chrome uzantısı, kullanıcıların resimlerden metin kopyalayıp silmesine izin verir