Segala Informasi, Teknologi, Toturial ada disini...

Tuesday 28 January 2020

Natural Language Processing

sumber gambar : https://jemmaimages.blob.core.windows.net/
Dalam kehidupan sehari - hari komunikasi merupakan hal terpenting bagi manusia dalam menjalankan hidup antar sesama sebagai makhluk sosial. Hal itu tak luput dengan jutaan bahkan triliunan informasi yang ada di internet terutama pada website, dimana kebanyakaan menggunakan bahasa natural. Bahasa yang ambiguitas dan tidak baku kerap sekali sulit untuk dipahami arti dan maksud dari bahasa itu sendiri.

Dengan adanya Natural Language Processing (Pemrosesan Bahasa Alamiah) merupakan cabang kecerdasan buatan yang membantu komputer memahami, menafsirkan, dan memanipulasi bahasa manusia. NLP menarik dari banyak disiplin ilmu, termasuk ilmu komputer dan linguistik komputasional, dalam usahanya untuk mengisi kesenjangan antara komunikasi manusia dan pemahaman komputer.

Beberapa aplikasi yang menerapkan NLP diantaranya adalah Stemming atau Lemmatization yang berfungsi untuk pemotongan kata dalam bahasa tertentu menjadi bentuk dasar pengenalan fungsi setiap kata dalam kalimat, Translation Tools (menterjemahkan bahasa) adalah aplikasi yang memungkinkan komputer mampu memahami instruksi bahasa ke bahasa lain yang diinputkan oleh user, Chatbot adalah aplikasi yang membuat user bisa seolah-olah melakukan komunikasi dengan computer.

Perkembangan NLP menghasilkan kemungkinan dari interface bahasa natural menjadi knowledge base dan penterjemahan bahasa natural. Poole dan Mackworth (2010) menjelaskan bahwa ada 3 (tiga) aspek utama pada teori pemahaman mengenai natural language:

  • Syntax: menjelaskan bentuk dari bahasa. Syntax biasa dispesifikasikan oleh sebuah grammar. Natural language jauh lebih daripada formal language yang digunakan untuk logika kecerdasan buatan dan program komputer
  • Semantics: menjelaskan arti dari kalimat dalam satu bahasa. Meskipun teori semantics secara umum sudah ada, ketika membangun sistem natural language understanding untuk aplikasi tertentu, akan digunakan representasi yang paling sederhana.
  • Pragmatics: menjelaskan bagaimana pernyataan yang ada berhubungan dengan dunia. Untuk memahami bahasa, agen harus mempertimbangan lebih dari hanya sekedar kalimat. Agen harus melihat lebih ke dalam konteks kalimat, keadaan dunia, tujuan dari speaker dan listener, konvensi khusus, dan sejenisnya.
  • Fonetik. Adalah segala hal yang berhubungan dengan suara yang menghasilkan kata yang dapat dikenali. Fonetik digunakan dalam pengembangan NLP khususnya bidang speech based system

Contoh kalimat di bawah ini akan membantu untuk memahami perbedaan diantara ketiga aspek tersebut di atas. Kalimat-kalimat ini adalah kalimat yang mungkin muncul pada bagian awal dari sebuah buku Artificial Intelligence (AI):

  1. This book is about Artificial Intelligence
  2. The green frogs sleep soundly
  3. Colorless green ideas sleep furiously
  4. Furiously sleep ideas green colorless

Kalimat pertama akan tepat jika diletakkan pada awal sebuah buku, karena tepat secara sintaks, semantik, dan pragmatik. Kalimat kedua tepat secara sintaks dan semantic, namun kalimat tersebut akan menjadi aneh apabila diletakkan pada awal sebuah buku AI, sehingga kalimat ini tidak tepat secara pragmatik. Kalimat ketiga tepat secara sintaks, tetapi tidak secara semantik. Sedangkan pada kalimat keempat, tidak tepat secara sintaks, semantik, dan pragmatik.

Contoh Aplikasi 

1. Translation Tools/Machine Translation, program yang mampu mentranslasi kalimat baik berupa teks maupun suara dari satu bahasa alami ke bahasa lainnya.

2. Chatbot,  program komputer yang didesain untuk mensimulasikan sebuah percakapan cerdas dengan satu atau lebih pengguna manusia melalui inputan suara atau teks, utamanya digunakan untuk percakapan kecil.
sumber : https://images.squarespace-cdn.com/



Tantangan dalam NLP
  1. Ambiguitas bahasa alami.
  2. Representasi pengetahuan adalah tugas yang sulit.
  3. Terdapat berbagai tingkat informasi dalam bahasa kita.
  4. Terdapat beragam aplikasi untuk teknologi bahasa.
NLP adalah bidang studi tersulit dalam kecerdasan buatan. Tetapi, jika kita berhasil dalam pengembangan NLP maka dampak positifnya sangatlah besar. Contoh-contoh diatas hanyalah sebagian dari aplikasi di seluruh dunia yang telah mengaplikasikan NLP.

Perkembangan komputer di masa sekarang berada pada generasi komputer keempat. Pada generasi komputer kelima (masa depan – masih imajinasi), komputer telah mampu dioperasikan hanya dengan inputan suara manusia. Selain itu, komputer telah mampu untuk memprogram dirinya sendiri sehingga bisa saja mungkin pemikirannya mengalahkan pemikiran manusia.

Refrensi :
  • Ingason, K., Helgadóttir, S., Loftsson, H., Rögnvaldsson, E. (2008). A Mixed Method Lemmatization Algorithm Using a Hierarchy of Linguistic Identities (HOLI). Aarne Ranta (Eds,). Advances in Natural Language Processing.
  • http://en.wikipedia.org/wiki/Natural_language_processing
  • http://en.wikipedia.org/wiki/Natural_language_processing
  • http://en.wikipedia.org/wiki/Machine_translation

0 comments:

Post a Comment