Halaman

Minggu, 09 April 2017

Pengantar Web Science

Pengantar Web Science

BAB 1 dan BAB 2
World Wide Web atau yang lebih dikenal dengan WWW merupakan sebuah teknologi yang berkembang dengan membutuhkan waktu beberapa tahun saja, program pertama yang bukan saja menggunakan FTP (File Transfer Protocol) namun juga HTTP (Hypertext Transfer Protocol) yang dikembangkan Tim Berners-Lee pada 1989. WorldWideWeb dapat menampilkan file HTML tanpa gambar yang tersimpan. Pengaruh dari world wide web ini sangat luar biasa dan sudah dirasakan oleh masyarakat di dunia. Untuk mempelajari bagaimana WWW berkembang sangat pesat maka kita membutuhkan Web Science.
Web Scince merupakan ilmu pengetahuan yang membahas tentang bagaimana sebuah web diciptakan agar menjadi sebuah jalan dimana dalam semua masalah yang ada didunia saat ini dapat disebarluaskan secara cepat , tepat dan efisien. Tujuan penting dari web science adalah untuk mengenali aspek penting dari identifikasi, interaksi dan representasi yang membuat web bekerja, dan mengijinkan implementasi dari system yang bisa mendukung dan mempromosikan perilaku yang diinginkan
Web adalah ruang di mana sumber daya diidentifikasi oleh Uniform Resource Identifier (URI). Ada protokol yang di gunakan untuk mendukung interaksi antara agen, dan format untuk mewakili informasi sumber. Ini adalah bahan dasar (Arsitektur) dari Web yang memiliki tiga fungsi dari identifikasi, interaksi dan representasi. Kekuatan web berasal dari kemungkinan menghubungkan server dan klien. Sebuah sumber dapat berisi sebuah referensi ke sumber lain dalam bentuk sebuah URI dimana bisa digunakan untuk akses sumber kedua. Link itu mengijinkan navigasi asosiatif dari web. Untuk memudahkan peghubungan, sebuah format harus termasuk cara membuat dan mengenali link ke sumber lain, harus mengizinkan link ke beberapa sumber dimanapun melalui web, dan seharusnya tidak membatasi penulis konten menggunakan skema URI tertentu.
BAB 3
1.     Semantik Web
Semantic Web (SW) merupakan upaya untuk memperluas potensi Web dengan ekstensi analogi perilaku rakyat. Semantic Web mencoba untuk mendapati orang-orang yang bersedia membuat data untuk orang lain, dan menambahkan link untuk dapat mereka akses ke link tersebut. Jadi visi Semantic Web adalah sebagai perluasan dari prinsip-prinsip Web dari dokumen ke data. Jika itu terjadi dan diterima, maka perluasan ini akan memenuhi lebih dari Web yang potensial, yang akan memungkinkan data dapat digunakan dengan effektif oleh masyarakat yang lebih luas, dan akan diproses baik secara otomatis atau manual oleh perangkat. Hal ini, dapat menciptakan sebuah kebutuhan besar: perangkat tersebut harus mampu memproses data dalam format heterogen, mengumpulkan data-data dengan menggunakan prinsip-prinsip yang berbeda untuk berbagai macam tugas utama. Kemampuan Web akan jauh lebih besar jika data dapat didefinisikan dan dihubungkan sehingga mesin dapat melampaui tampilan, dan sebaliknya mengintegrasikan argumen tentang data di aplikasi (dan di seluruh organisasi atau batas-batas masyarakat). Saat ini, Web berkerja dengan baik pada teks, musik dan gambar, dan cukup baik pada video dan layanan, tetapi data tidak dapat digunakan dengan mudah pada skala Web. Tujuan Semantic Web adalah untuk memfasilitasi penggunaan data serta penemuan mereka, untuk melampaui Google dalam hal ini.
Jadi cara kerja semantic web seperti web kebanyakan pada saat ini , jika kita ingin mencari sesuatu dan keyword yang kita ketikan salah atau typo , maka web tersebut akan ototmatis memberikan option pilihan dari yang kita maksud, sehingga web semantic dapat mengurangi kesalahan-kesalahan yang dilakukan oleh manusia itu sendiri maupun oleh web itu sendiri dan akan menampilkan hasil yang lebih akurat sesuai dengan pengguna inginkan.
Berikut Strategi Semantic Web adalah untuk memberikan kerangka umum untuk pembebasan data, didasarkan pada Resource Description Framework (RDF), yang mengintegrasikan berbagai aplikasi yang menggunakan XML sebagai sintaks interchange. Data mentah dibawa bersama-sama ke dalam database, dan terhubung ke model dunia (melalui ontology) yang kemudian memungkinkan agregasi dan analisis data dengan memproduksi interpretasi yang konsisten di seluruh sumber data heterogen. Fokus, pada data itu sendiri. Semantic Web ini tidak hanya menandai masalah dokumen HTML di Web, atau varian pada masalah IR tradisional pengambilan dokumen. Ini adalah upaya untuk menyatukan data di Web sehingga untuk membuat database besar yang melampaui komponennya, kemungkinan yang membuat aplikasi dapat menyimpulkan di seluruh data heterogen
       Database merupakan jenis pemanfaatan yang dipahami sebagai dasar untuk sumber Semantic Web. Jadi, Semantic Web adalah lanjutan dari WWW yang menjadi tahap berikutnya yakni, menghubungkan data bukan dokumen. Hal ini, bukanlah satu set metode yang menangani dokumen pada Web saat ini secara spesifik, bukan satu set metode keputusan yang berdasarkan metadata atau cara untuk mengklasifikasikan laman web saat ini, atau cara mencari smart-way. Hal ini dimaksudkan untuk berfungsi dalam konteks relational model data.

2.     Ontologi
Ontologi mengandung konsep-konsep yang diperlukan untuk memahami domain dan kosa kata yang diperlukan untuk masuk ke sebuah tulisan tentang itu, dan bagaimana konsep dan kosa kata yang saling terkait, bagaimana kelas dan contoh dan sifat mereka yang didefinisikan, dijelaskan dan dirujuk. Ontologi bersifat formal maupun informal. Keuntungan dari formalitas adalah bahwa itu membuat ontologi yang dapat dibaca mesin, dan karena itu memungkinkan komputer untuk melakukan penalaran yang lebih atas sumber daya Web.
Ontologi dimaksudkan untuk menempatkan semacam keteraturan ke dalam format informasi dan pernyataan heterogen, dan berkontribusi melihat Web sebagai sumber pengetahuan tunggal. Sejauh itu, Ontologi mirip dengan skema database, kecuali akan ditulis dengan banyak bahasa yang relatif dan ekspresif, informasi akan kurang terstruktur, dan menentukan teori domain, tidak hanya struktur data container. Jadi ontologi terlihat sebagai tambahan yang penting untuk berbagi data, dan tujuan utama membenarkan Web sebagai satu sumber informasi, tetapi mereka juga memiliki penentangnya
3.     Folksonomies dan struktur sosial
Ontologi harus dilengkapi dengan folksonomi, yang muncul ketika sejumlah orang tertarik pada beberapa informasi, dan didorong untuk menggambarkannya- atau tag (mereka mungkin tag selfishly, untuk mengatur pengambilan konten mereka sendiri, atau membantu orang lain untuk mendapatkan navigasi). Daripada bentuk klasifikasi terpusat, pengguna dapat menetapkan kata kunci dokumen-dokumen atau sumber-sumber informasi lain. Dan ketika Tag ini dikumpulkan, hasilnya sangat menarik.
Folksonomi adalah varian bertarget pada kata kunci yang mencari tema, dan merupakan upaya yang muncul menarik di informasi pengambilan - bagaimana saya bisa mengambil dokumen (foto). Contohnya adalah Wikipedia , Wikipedia merupakan web yang dapat diubah atau diedit oleh orang lain dengan bebas , hal ini memungkinkan informasi yang dimiliki oleh sesorang dari kalangan manapun dapat di sebarluaskan melalu web Wikipedia dengan menyunting salah satu berita , dimana berita tersebut dimengerti oleh orang tersebut.
4.     Referensi dan Identitas
1.      Kapan Dua Objek itu Sama?
Dua Objek dikatakan sama , ketika kita typo mengetikan keyword pada salah satu search engine contohnya ialah, Aldo Sudibyo dan saya typo menjadi Adlo Sudibyo ,mungkin menurut kita sebagai pengguna akan terlihat sepele , namun untuk search engine hal ini merupakan hal yang rumit
2.      Kapan Dua Halaman itu Sama?
Dua hal dikatakan sama ketika template suatu halaman web , letak gadgetnya ,
isi dari web nya sampai hal terkecil dari web tersebut sama dengan web lainnya. Jika salah satu ada yang beda maka halaman tersebut dikatakan tidak sama dan berbeda satu dengan yang lainnya.
3.      Multimedia
Web merupakan multimedia, yang dibuat untuk kompleks semantic. Ini tentu bukan masalah yang unik ke Web. Meta-reasoning (Penalaran tentang sifat penalaran itu sendiri) dan Epistemology (Ilmu tentang sifat) sering menganggap media tekstual, meskipun sebenarnya banyak pertimbangan dalam bentuk analogy. Sebagai contoh ahli sering menggunakan diagram untuk mengekpresikan pengetahuan mereka. Beberapa peneliti telah mencoba untuk menemukan prinsip-prinsip yang mungkin mendasari penalaran diagramatik. Telah ada juga aplikasi penting untuk decoding representasi visual untuk gangguan penglihatan dan koleksi gambar visualisasi terhadap ontologi domain. Pada akhirnya, integrasi representasi multimodal dari adegan yang sama atau badan adalah masalah yang sangat parah. Secara umum, itu tidak diketahui bagaimana mengambil semantik dari representasi non-tekstual handal; fenomena ini disebut sebagai semantic gap (semantik kesenjangan).
            Namun, generasi web berikutnya tidak harus berdasarkan pada asumsi yang salah bahwa teks adalah utama dan perncarian berbasis keyword(kata kunci) akan akan memadai semua tujuan yang wajar. Namun, pendekatan kata kunci mungkin goyah dalam konteks multimedia karena kekayaan yang lebih besar berasal dari non-tekstual media. Sebagai hybrid yang menarik telah disarankan bahwa kesenjangan semantik (semantic gap) dapat diisi dengan ontology dari visual yang memuat bahasa tingkat rendah dan memberikan urutan pemetaan atas konsep abstrak tingkat tinggi yang disajikan dalam bentuk queries (pertanyaan) atau metadata.
           
5.     Pemrosesan Bahasa Alami (Natural Language Processing/NPL)
Terdapat hal-hal penting yang berkaitan antara NPL dengan jaringn (web), diantaranya :
  1. Sebelumnya Natural Language sangat jarang digunakan, namun setelah beberapa tulisan membicarakan mengenai NPL hal inilah yang membuat NPL dipertimbangkan. Sebuah angka perkiraan baru-baru ini untuk ukuran dari Web adalah dua ribu miliar kata, yang 71% adalah bahasa Inggris, 6,8% Jepang dan 5,1% Jerman. banyak yang relatif bahasa umum seperti Slovenia atau Melayu bisa membanggakan 100m kata online, ukuran yang sama seperti Nasional Inggris yang banyak digunakan dan dihormati.
  2. Mengingat masalah dari skala Web, teknik NLP akan menjadi penting dalam tugas-tugas seperti summarisation (lihat, misalnya, tahunan Dokumen Memahami Conference - http://duc.nist.gov/ dan [69]), yang dapat memberikan dukungan yang berguna untuk bagian-bagian manusia tugas pencarian.
  3.  NLP memiliki potensi besar untuk pembangunan jenis antarmuka intuitif yang heterogen dan belum tentu computerliterateWeb komunitas pengguna membutuhkan. NLP digunakan untuk menemukan dan mengungkapkan metadata. Teks yang mengandung tidak terstruktur data sekarang dapat dipetakan ke sumber daya yang ada seperti ontologi untuk menyediakan markup dan penjelasan, setelah sesi pelatihan awal.