Visi komputer

Visi komputer atau penglihatan komputer adalah bidang ilmiah antardisiplin yang membahas bagaimana komputer dapat memperoleh pemahaman tingkat tinggi dari gambar atau video digital. Dari perspektif teknik, bidang ini berupaya mengotomatiskan tugas-tugas yang dapat dilakukan oleh sistem penglihatan manusia.^[1]^[2]^[3]

Tugas visi komputer meliputi metode untuk memperoleh, memproses, menganalisis dan memahami gambar digital, dan ekstraksi data dimensi tinggi dari dunia nyata untuk menghasilkan informasi numerik atau simbolis, misalnya, dalam bentuk keputusan.^[4]^[5]^[6]^[7] Pengertian dalam konteks ini berarti transformasi gambar visual (input retina) menjadi deskripsi mengenai dunia sekitar yang dapat berinteraksi dengan proses pemikiran lain dan memperoleh tindakan yang sesuai. Pemahaman gambar ini dapat dilihat sebagai penguraian informasi simbolik dari data gambar menggunakan model yang dibangun dengan bantuan geometri, fisika, statistik, dan teori pembelajaran.^[8]

Sub-domain dari visi komputer meliputi rekonstruksi adegan, deteksi peristiwa, pelacakan video, pengenalan objek, estimasi pose 3D, pembelajaran, pengindeksan, estimasi gerakan, dan pemulihan gambar.^[6]

Definisi

Visi komputer adalah bidang antardisiplin yang membahas bagaimana komputer dapat direkayasa untuk mendapatkan pemahaman tingkat tinggi dari masukan data berupa gambar atau video digital. Dari perspektif teknik, bidang ini berupaya mengotomasikan tugas-tugas yang dapat dilakukan oleh sistem penglihatan manusia.^[1]^[2]^[3] "Visi komputer berkaitan dengan ekstraksi otomatis, analisis, dan pemahaman informasi yang berguna dari satu gambar atau urutan gambar. Ini melibatkan pengembangan dasar teoritis dan algoritmik untuk mencapai pemahaman visual otomatis".^[9] Sebagai disiplin ilmu, visi komputer berkaitan dengan teori di balik sistem buatan yang mengekstraksi informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera, atau data multidimensi dari pemindai medis.^[10]

Sejarah

Pada akhir 1960-an, visi komputer dimulai di universitas yang merintis kecerdasan buatan. Teknologi ini dimaksudkan untuk meniru sistem penglihatan manusia, sebagai batu loncatan untuk memberkahi robot dengan perilaku cerdas.^[11] Pada tahun 1966, diyakini bahwa ini dapat dicapai melalui proyek musim panas, dengan menempelkan kamera ke komputer dan membuatnya "menggambarkan apa yang dilihatnya".^[12]^[13]

Apa yang membedakan visi komputer dari bidang pengolahan gambar digital yang lazim pada waktu itu adalah keinginan untuk mengekstraksi struktur tiga dimensi dari gambar dengan tujuan mencapai pemahaman adegan penuh. Studi pada tahun 1970-an membentuk fondasi awal untuk banyak algoritma visi komputer yang ada saat ini, termasuk ekstraksi tepi dari gambar, pelabelan garis, pemodelan non-polihedral dan polihedral, representasi objek sebagai interkoneksi dari struktur yang lebih kecil, aliran optik, dan estimasi gerak.^[11]

Dekade berikutnya ditandai dengan studi berdasarkan analisis matematika yang lebih ketat dan aspek kuantitatif dari visi komputer. Ini termasuk konsep matematika skala-ruang, inferensi bentuk dari berbagai isyarat seperti bayangan, tekstur dan fokus, serta model kontur yang dikenal sebagai snake. Para peneliti juga menyadari bahwa banyak dari konsep-konsep matematika ini dapat diperlakukan dalam kerangka optimisasi yang sama seperti regularisasi dan bidang acak Markov.^[14]

Pada 1990-an, beberapa topik penelitian sebelumnya menjadi lebih aktif daripada yang lain. Penelitian dalam rekonstruksi 3D proyektif menyebabkan pemahaman yang lebih baik mengenai kalibrasi kamera. Dengan munculnya metode optimasi untuk kalibrasi kamera, disadari bahwa banyak ide yang telah dieksplorasi dalam teori penyesuaian bundel dari bidang fotogrametri. Ini mengarah pada metode rekonstruksi 3-D dari beberapa gambar. Kemajuan dibuat dalam masalah korespondensi stereo padat dan teknik stereo multipandang yang lebih maju. Pada saat yang sama, variasi potongan grafik digunakan untuk menyelesaikan segmentasi gambar. Dekade ini juga menandai pertama kalinya teknik pembelajaran statistik digunakan dalam praktik untuk mengenali wajah dalam gambar (lihat Eigenface). Menjelang akhir 1990-an, perubahan signifikan terjadi dengan meningkatnya interaksi antara bidang grafis komputer dengan visi komputer. Ini termasuk rendering berbasis gambar, perubahan gambar, interpolasi tampilan, jahitan gambar panorama dan rendering bidang cahaya awal.^[11]

Perkembangan terkini ditandai dengan kebangkitan metode berbasis fitur, digunakan bersama dengan teknik pembelajaran mesin dan kerangka kerja optimasi yang kompleks.^[15]^[16]

Penerapan di Indonesia

Penerapan teknologi visi komputer di Indonesia telah dilakukan dalam berbagai aspek. Seperti diantaranya penegakan disiplin lalu lintas melalui teknologi yang dikembangkan oleh Polisi Republik Indonesia, ^[17] dan sistem pengukur kecepatan kendaraan berbasis video.^[18]

Lihat pula

Referensi

^ ^a ^b Dana H. Ballard; Christopher M. Brown (1982). Computer Vision. Prentice Hall. ISBN 978-0-13-165316-0.
^ ^a ^b Huang, T. (1996-11-19). Vandoni, Carlo, E (ed.). Computer Vision : Evolution And Promise (PDF). 19th CERN School of Computing. Geneva: CERN. pp. 21–25. doi:10.5170/CERN-1996-008.21. ISBN 978-9290830955.
^ ^a ^b Milan Sonka; Vaclav Hlavac; Roger Boyle (2008). Image Processing, Analysis, and Machine Vision. Thomson. ISBN 978-0-495-08252-1.
^ Reinhard Klette (2014). Concise Computer Vision. Springer. ISBN 978-1-4471-6320-6.
^ Linda G. Shapiro; George C. Stockman (2001). Computer Vision. Prentice Hall. ISBN 978-0-13-030796-5.
^ ^a ^b Tim Morris (2004). Computer Vision and Image Processing. Palgrave Macmillan. ISBN 978-0-333-99451-1.
^ Bernd Jähne; Horst Haußecker (2000). Computer Vision and Applications, A Guide for Students and Practitioners. Academic Press. ISBN 978-0-13-085198-7.
^ David A. Forsyth; Jean Ponce (2003). Computer Vision, A Modern Approach. Prentice Hall. ISBN 978-0-13-085198-7.
^ http://www.bmva.org/visionoverview Diarsipkan 2017-02-16 di Wayback Machine. The British Machine Vision Association and Society for Pattern Recognition Retrieved February 20, 2017
^ Murphy, Mike. "Star Trek's "tricorder" medical scanner just got closer to becoming a reality".
^ ^a ^b ^c Richard Szeliski (30 September 2010). Computer Vision: Algorithms and Applications. Springer Science & Business Media. pp. 10–16. ISBN 978-1-84882-935-0.
^ Papert, Seymour (1966-07-01). "The Summer Vision Project". MIT AI Memos (1959 - 2004). hdl:1721.1/6125.
^ Margaret Ann Boden (2006). Mind as Machine: A History of Cognitive Science. Clarendon Press. p. 781. ISBN 978-0-19-954316-8.
^ Takeo Kanade (6 December 2012). Three-Dimensional Machine Vision. Springer Science & Business Media. ISBN 978-1-4613-1981-8.
^ Nicu Sebe; Ira Cohen; Ashutosh Garg; Thomas S. Huang (3 June 2005). Machine Learning in Computer Vision. Springer Science & Business Media. ISBN 978-1-4020-3274-5.
^ William Freeman; Pietro Perona; Bernhard Scholkopf (2008). "Guest Editorial: Machine Learning for Computer Vision". International Journal of Computer Vision. 77 (1): 1. doi:10.1007/s11263-008-0127-7. ISSN 1573-1405.
^ Ferdian, Azwar, ed. (2022-06-07). "Pekan Depan, Tilang Manual Dihapus dan Diganti Tilang Elektronik". Kompas.com. Diakses tanggal 2022-06-09.
^ Sadewo, Satrio Sani; Sumiharto, Raden; Candradewi, Ika (2015-10-31). "Sistem Pengukur Kecepatan Kendaraan Berbasis Pengolahan Video". IJEIS (Indonesian Journal of Electronics and Instrumentation Systems) (dalam bahasa Inggris). 5 (2): 177–186. doi:10.22146/ijeis.7641. ISSN 2460-7681.

Bacaan lanjutan

David Marr (1982). Vision. W. H. Freeman and Company. ISBN 978-0-7167-1284-8.
Azriel Rosenfeld; Avinash Kak (1982). Digital Picture Processing. Academic Press. ISBN 978-0-12-597301-4.
Barghout, Lauren; Lawrence W. Lee (2003). Perceptual information processing system. U.S. Patent Application 10/618,543. ISBN 978-0-262-08159-7.
Berthold K.P. Horn (1986). Robot Vision. MIT Press. ISBN 978-0-262-08159-7.
Michael C. Fairhurst (1988). Computer Vision for robotic systems. Prentice Hall. ISBN 978-0-13-166919-2.
Olivier Faugeras (1993). Three-Dimensional Computer Vision, A Geometric Viewpoint. MIT Press. ISBN 978-0-262-06158-2.
Tony Lindeberg (1994). Scale-Space Theory in Computer Vision. Springer. ISBN 978-0-7923-9418-1.
James L. Crowley and Henrik I. Christensen (Eds.) (1995). Vision as Process. Springer-Verlag. ISBN 978-3-540-58143-7.
Gösta H. Granlund; Hans Knutsson (1995). Signal Processing for Computer Vision. Kluwer Academic Publisher. ISBN 978-0-7923-9530-0.
Reinhard Klette; Karsten Schluens; Andreas Koschan (1998). Computer Vision – Three-Dimensional Data from Images. Springer, Singapore. ISBN 978-981-3083-71-4.
Emanuele Trucco; Alessandro Verri (1998). Introductory Techniques for 3-D Computer Vision. Prentice Hall. ISBN 978-0-13-261108-4.
Bernd Jähne (2002). Digital Image Processing. Springer. ISBN 978-3-540-67754-3.
Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in Computer Vision. Cambridge University Press. ISBN 978-0-521-54051-3.
Gérard Medioni; Sing Bing Kang (2004). Emerging Topics in Computer Vision. Prentice Hall. ISBN 978-0-13-101366-7.
R. Fisher; K Dawson-Howe; A. Fitzgibbon; C. Robertson; E. Trucco (2005). Dictionary of Computer Vision and Image Processing. John Wiley. ISBN 978-0-470-01526-1.
Nikos Paragios and Yunmei Chen and Olivier Faugeras (2005). Handbook of Mathematical Models in Computer Vision. Springer. ISBN 978-0-387-26371-7.
Wilhelm Burger; Mark J. Burge (2007). Digital Image Processing: An Algorithmic Approach Using Java. Springer. ISBN 978-1-84628-379-6.
Pedram Azad; Tilo Gockel; Rüdiger Dillmann (2008). Computer Vision – Principles and Practice. Elektor International Media BV. ISBN 978-0-905705-71-2.
Richard Szeliski (2010). Computer Vision: Algorithms and Applications. Springer-Verlag. ISBN 978-1848829343.
J. R. Parker (2011). Algorithms for Image Processing and Computer Vision (2nd ed.). Wiley. ISBN 978-0470643853.
Richard J. Radke (2013). Computer Vision for Visual Effects. Cambridge University Press. ISBN 978-0-521-76687-6.
Nixon, Mark; Aguado, Alberto (2019). Feature Extraction and Image Processing for Computer Vision (edisi ke-4th). Academic Press. ISBN 978-0128149768.

Pranala luar

USC Iris computer vision conference list
Computer vision papers on the web A complete list of papers of the most relevant computer vision conferences.
Computer Vision Online News, source code, datasets and job offers related to computer vision.
Keith Price's Annotated Computer Vision Bibliography
CVonline Bob Fisher's Compendium of Computer Vision.
British Machine Vision Association Supporting computer vision research within the UK via the BMVC and MIUA conferences, Annals of the BMVA (open-source journal), BMVA Summer School and one-day meetings
Computer Vision Container, Joe Hoeller GitHub: Widely adopted open-source container for GPU accelerated computer vision applications. Used by researchers, universities, private companies as well as the U.S. Gov't.

[Ballard-Brown-19822-1] Dana H. Ballard; Christopher M. Brown (1982). Computer Vision. Prentice Hall. ISBN 978-0-13-165316-0.

[Huang-19962-2] Huang, T. (1996-11-19). Vandoni, Carlo, E (ed.). Computer Vision : Evolution And Promise (PDF). 19th CERN School of Computing. Geneva: CERN. pp. 21–25. doi:10.5170/CERN-1996-008.21. ISBN 978-9290830955.

[Sonka-Hlavac-Boyle-20082-3] Milan Sonka; Vaclav Hlavac; Roger Boyle (2008). Image Processing, Analysis, and Machine Vision. Thomson. ISBN 978-0-495-08252-1.

[Klette-2014-4] Reinhard Klette (2014). Concise Computer Vision. Springer. ISBN 978-1-4471-6320-6.

[Shapiro-Stockman-2001-5] Linda G. Shapiro; George C. Stockman (2001). Computer Vision. Prentice Hall. ISBN 978-0-13-030796-5.

[Morris-20042-6] Tim Morris (2004). Computer Vision and Image Processing. Palgrave Macmillan. ISBN 978-0-333-99451-1.

[Jahne-Haussecker-2000-7] Bernd Jähne; Horst Haußecker (2000). Computer Vision and Applications, A Guide for Students and Practitioners. Academic Press. ISBN 978-0-13-085198-7.

[Forsyth-Ponce-2003-8] David A. Forsyth; Jean Ponce (2003). Computer Vision, A Modern Approach. Prentice Hall. ISBN 978-0-13-085198-7.

[bmva-9] ttp://www.bmva.org/visionoverview Diarsipkan 2017-02-16 di Wayback Machine. The British Machine Vision Association and Society for Pattern Recognition Retrieved February 20, 2017

[10] Murphy, Mike. "Star Trek's "tricorder" medical scanner just got closer to becoming a reality".

[Szeliski20103-11] Richard Szeliski (30 September 2010). Computer Vision: Algorithms and Applications. Springer Science & Business Media. pp. 10–16. ISBN 978-1-84882-935-0.

[Seymour1966-12] Papert, Seymour (1966-07-01). "The Summer Vision Project". MIT AI Memos (1959 - 2004). hdl:1721.1/6125.

[Boden2006-13] Margaret Ann Boden (2006). Mind as Machine: A History of Cognitive Science. Clarendon Press. p. 781. ISBN 978-0-19-954316-8.

[Kanade20122-14] Takeo Kanade (6 December 2012). Three-Dimensional Machine Vision. Springer Science & Business Media. ISBN 978-1-4613-1981-8.

[Sebe2005-15] Nicu Sebe; Ira Cohen; Ashutosh Garg; Thomas S. Huang (3 June 2005). Machine Learning in Computer Vision. Springer Science & Business Media. ISBN 978-1-4020-3274-5.

[Freeman2008-16] William Freeman; Pietro Perona; Bernhard Scholkopf (2008). "Guest Editorial: Machine Learning for Computer Vision". International Journal of Computer Vision. 77 (1): 1. doi:10.1007/s11263-008-0127-7. ISSN 1573-1405.

[17] Ferdian, Azwar, ed. (2022-06-07). "Pekan Depan, Tilang Manual Dihapus dan Diganti Tilang Elektronik". Kompas.com. Diakses tanggal 2022-06-09.

[18] Sadewo, Satrio Sani; Sumiharto, Raden; Candradewi, Ika (2015-10-31). "Sistem Pengukur Kecepatan Kendaraan Berbasis Pengolahan Video". IJEIS (Indonesian Journal of Electronics and Instrumentation Systems) (dalam bahasa Inggris). 5 (2): 177–186. doi:10.22146/ijeis.7641. ISSN 2460-7681.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]