Pengantar Web Science
BAB 1 dan BAB 2
World Wide Web atau yang lebih
dikenal dengan WWW merupakan sebuah
teknologi yang berkembang dengan membutuhkan waktu beberapa tahun saja, program
pertama yang bukan saja menggunakan FTP (File Transfer Protocol) namun juga
HTTP (Hypertext Transfer Protocol) yang dikembangkan Tim Berners-Lee pada 1989.
WorldWideWeb dapat menampilkan file HTML tanpa gambar yang tersimpan. Pengaruh
dari world wide web ini sangat luar biasa dan sudah dirasakan oleh masyarakat
di dunia. Untuk mempelajari bagaimana WWW berkembang sangat pesat maka kita
membutuhkan Web Science.
Web Scince merupakan ilmu pengetahuan
yang membahas tentang bagaimana sebuah web diciptakan agar menjadi sebuah jalan
dimana dalam semua masalah yang ada didunia saat ini dapat disebarluaskan
secara cepat , tepat dan efisien. Tujuan penting dari web science adalah untuk mengenali aspek
penting dari identifikasi, interaksi dan representasi yang membuat web bekerja,
dan mengijinkan implementasi dari system yang bisa mendukung dan mempromosikan
perilaku yang diinginkan
Web adalah ruang di mana sumber daya
diidentifikasi oleh Uniform Resource Identifier (URI). Ada protokol yang di
gunakan untuk mendukung interaksi antara agen, dan format untuk mewakili
informasi sumber. Ini adalah bahan dasar (Arsitektur) dari Web yang memiliki
tiga fungsi dari identifikasi, interaksi dan representasi. Kekuatan web berasal
dari kemungkinan menghubungkan server dan klien. Sebuah sumber dapat berisi
sebuah referensi ke sumber lain dalam bentuk sebuah URI dimana bisa digunakan
untuk akses sumber kedua. Link itu mengijinkan navigasi asosiatif dari web.
Untuk memudahkan peghubungan, sebuah format harus termasuk cara membuat dan
mengenali link ke sumber lain, harus mengizinkan link ke beberapa sumber
dimanapun melalui web, dan seharusnya tidak membatasi penulis konten
menggunakan skema URI tertentu.
BAB 3
1. Semantik Web
Semantic
Web (SW) merupakan upaya untuk memperluas potensi Web dengan ekstensi analogi
perilaku rakyat. Semantic Web mencoba untuk mendapati orang-orang yang bersedia
membuat data untuk orang lain, dan menambahkan link untuk dapat mereka akses ke
link tersebut. Jadi visi Semantic Web adalah sebagai perluasan dari
prinsip-prinsip Web dari dokumen ke data. Jika itu terjadi dan diterima, maka
perluasan ini akan memenuhi lebih dari Web yang potensial, yang akan
memungkinkan data dapat digunakan dengan effektif oleh masyarakat yang lebih
luas, dan akan diproses baik secara otomatis atau manual oleh perangkat. Hal
ini, dapat menciptakan sebuah kebutuhan besar: perangkat tersebut harus mampu
memproses data dalam format heterogen, mengumpulkan data-data dengan
menggunakan prinsip-prinsip yang berbeda untuk berbagai macam tugas utama.
Kemampuan Web akan jauh lebih besar jika data dapat didefinisikan dan
dihubungkan sehingga mesin dapat melampaui tampilan, dan sebaliknya
mengintegrasikan argumen tentang data di aplikasi (dan di seluruh organisasi
atau batas-batas masyarakat). Saat ini, Web berkerja dengan baik pada teks,
musik dan gambar, dan cukup baik pada video dan layanan, tetapi data tidak
dapat digunakan dengan mudah pada skala Web. Tujuan Semantic Web adalah untuk
memfasilitasi penggunaan data serta penemuan mereka, untuk melampaui Google
dalam hal ini.
Jadi
cara kerja semantic web seperti web kebanyakan pada saat ini , jika kita ingin
mencari sesuatu dan keyword yang kita ketikan salah atau typo , maka web
tersebut akan ototmatis memberikan option pilihan dari yang kita maksud,
sehingga web semantic dapat mengurangi kesalahan-kesalahan yang dilakukan oleh
manusia itu sendiri maupun oleh web itu sendiri dan akan menampilkan hasil yang
lebih akurat sesuai dengan pengguna inginkan.
Berikut
Strategi Semantic Web adalah untuk memberikan kerangka umum untuk pembebasan
data, didasarkan pada Resource Description Framework (RDF), yang
mengintegrasikan berbagai aplikasi yang menggunakan XML sebagai sintaks
interchange. Data mentah dibawa bersama-sama ke dalam database, dan terhubung
ke model dunia (melalui ontology) yang kemudian memungkinkan agregasi dan
analisis data dengan memproduksi interpretasi yang konsisten di seluruh sumber
data heterogen. Fokus, pada data itu sendiri. Semantic Web ini tidak hanya
menandai masalah dokumen HTML di Web, atau varian pada masalah IR tradisional
pengambilan dokumen. Ini adalah upaya untuk menyatukan data di Web sehingga
untuk membuat database besar yang melampaui komponennya, kemungkinan yang
membuat aplikasi dapat menyimpulkan di seluruh data heterogen
Database merupakan jenis pemanfaatan
yang dipahami sebagai dasar untuk sumber Semantic Web. Jadi, Semantic Web adalah
lanjutan dari WWW yang menjadi tahap berikutnya yakni, menghubungkan data bukan
dokumen. Hal ini, bukanlah satu set metode yang menangani dokumen pada
Web saat ini secara spesifik, bukan satu set metode keputusan yang berdasarkan
metadata atau cara untuk mengklasifikasikan laman web saat ini, atau cara
mencari smart-way. Hal ini dimaksudkan untuk berfungsi dalam konteks relational
model data.
2. Ontologi
Ontologi
mengandung konsep-konsep yang diperlukan untuk memahami domain dan kosa kata
yang diperlukan untuk masuk ke sebuah tulisan tentang itu, dan bagaimana konsep
dan kosa kata yang saling terkait, bagaimana kelas dan contoh dan sifat mereka
yang didefinisikan, dijelaskan dan dirujuk. Ontologi bersifat formal maupun
informal. Keuntungan dari formalitas adalah bahwa itu membuat ontologi yang
dapat dibaca mesin, dan karena itu memungkinkan komputer untuk melakukan
penalaran yang lebih atas sumber daya Web.
Ontologi
dimaksudkan untuk menempatkan semacam keteraturan ke dalam format informasi dan
pernyataan heterogen, dan berkontribusi melihat Web sebagai sumber pengetahuan
tunggal. Sejauh itu, Ontologi mirip dengan skema database, kecuali akan ditulis
dengan banyak bahasa yang relatif dan ekspresif, informasi akan kurang
terstruktur, dan menentukan teori domain, tidak hanya struktur data container.
Jadi ontologi terlihat sebagai tambahan yang penting untuk berbagi data, dan
tujuan utama membenarkan Web sebagai satu sumber informasi, tetapi mereka juga
memiliki penentangnya
3. Folksonomies dan struktur sosial
Ontologi
harus dilengkapi dengan folksonomi, yang muncul ketika sejumlah orang tertarik
pada beberapa informasi, dan didorong untuk menggambarkannya- atau tag (mereka
mungkin tag selfishly, untuk mengatur pengambilan konten mereka sendiri, atau
membantu orang lain untuk mendapatkan navigasi). Daripada bentuk klasifikasi
terpusat, pengguna dapat menetapkan kata kunci dokumen-dokumen atau
sumber-sumber informasi lain. Dan ketika Tag ini dikumpulkan, hasilnya sangat
menarik.
Folksonomi adalah varian bertarget pada kata kunci
yang mencari tema, dan merupakan upaya yang muncul menarik di informasi
pengambilan - bagaimana saya bisa mengambil dokumen (foto). Contohnya
adalah Wikipedia , Wikipedia merupakan web yang dapat diubah atau diedit oleh
orang lain dengan bebas , hal ini memungkinkan informasi yang dimiliki oleh
sesorang dari kalangan manapun dapat di sebarluaskan melalu web Wikipedia
dengan menyunting salah satu berita , dimana berita tersebut dimengerti oleh
orang tersebut.
4. Referensi dan Identitas
1.
Kapan Dua Objek itu Sama?
Dua
Objek dikatakan sama , ketika kita typo mengetikan keyword pada salah satu
search engine contohnya ialah, Aldo Sudibyo dan saya typo menjadi Adlo Sudibyo
,mungkin menurut kita sebagai pengguna akan terlihat sepele , namun untuk
search engine hal ini merupakan hal yang rumit
2.
Kapan Dua Halaman itu Sama?
Dua hal dikatakan sama ketika template suatu halaman web ,
letak gadgetnya ,
isi
dari web nya sampai hal terkecil dari web tersebut sama dengan web lainnya.
Jika salah satu ada yang beda maka halaman tersebut dikatakan tidak sama dan
berbeda satu dengan yang lainnya.
3.
Multimedia
Web merupakan multimedia, yang dibuat untuk kompleks semantic. Ini tentu
bukan masalah yang unik ke Web. Meta-reasoning (Penalaran tentang sifat
penalaran itu sendiri) dan Epistemology (Ilmu tentang sifat) sering menganggap
media tekstual, meskipun sebenarnya banyak pertimbangan dalam bentuk analogy.
Sebagai contoh ahli sering menggunakan diagram untuk mengekpresikan pengetahuan
mereka. Beberapa peneliti
telah mencoba untuk menemukan prinsip-prinsip yang mungkin mendasari penalaran
diagramatik. Telah ada juga aplikasi penting untuk decoding representasi visual
untuk gangguan penglihatan dan koleksi gambar visualisasi terhadap ontologi
domain. Pada akhirnya, integrasi representasi multimodal dari adegan yang sama
atau badan adalah masalah yang sangat parah. Secara umum, itu tidak diketahui
bagaimana mengambil semantik dari representasi non-tekstual handal; fenomena
ini disebut sebagai semantic gap (semantik kesenjangan).
Namun,
generasi web berikutnya tidak harus berdasarkan pada asumsi yang salah bahwa
teks adalah utama dan perncarian berbasis keyword(kata kunci) akan akan memadai
semua tujuan yang wajar. Namun, pendekatan kata kunci mungkin goyah dalam
konteks multimedia karena kekayaan yang lebih besar berasal dari non-tekstual
media. Sebagai hybrid yang menarik telah disarankan bahwa kesenjangan semantik (semantic
gap) dapat diisi dengan ontology dari visual yang memuat bahasa tingkat rendah
dan memberikan urutan pemetaan atas konsep abstrak tingkat tinggi yang
disajikan dalam bentuk queries (pertanyaan) atau metadata.
5.
Pemrosesan Bahasa Alami (Natural Language Processing/NPL)
Terdapat hal-hal
penting yang berkaitan antara NPL dengan jaringn (web), diantaranya :
- Sebelumnya
Natural Language sangat jarang digunakan, namun setelah beberapa tulisan
membicarakan mengenai NPL hal inilah yang membuat NPL dipertimbangkan. Sebuah angka perkiraan baru-baru
ini untuk ukuran dari Web adalah dua ribu miliar kata, yang 71% adalah
bahasa Inggris, 6,8% Jepang dan 5,1% Jerman. banyak yang relatif bahasa
umum seperti Slovenia atau Melayu bisa membanggakan 100m kata online, ukuran
yang sama seperti Nasional Inggris yang banyak digunakan dan dihormati.
- Mengingat masalah dari skala Web, teknik
NLP akan menjadi penting dalam tugas-tugas seperti summarisation (lihat,
misalnya, tahunan Dokumen Memahami Conference - http://duc.nist.gov/ dan
[69]), yang dapat memberikan dukungan yang berguna untuk bagian-bagian
manusia tugas pencarian.
- NLP memiliki potensi besar untuk
pembangunan jenis antarmuka intuitif yang heterogen dan belum tentu
computerliterateWeb komunitas pengguna membutuhkan. NLP digunakan untuk
menemukan dan mengungkapkan metadata. Teks yang mengandung tidak
terstruktur data sekarang dapat dipetakan ke sumber daya yang ada seperti
ontologi untuk menyediakan markup dan penjelasan, setelah sesi pelatihan
awal.
Tidak ada komentar:
Posting Komentar