SAINS DATA DAN ANALISIS BIG DATA | TEAM TEACHING
M1
1. Persentase
proses terbesar sebanyak 60% pada Data Scientist adalah pada proses :
a. Building
and training test
b. Cleaning and Organizing Data
c. Collecting
data sets
d. Refining
Algorithm
2. Penerapan
utama data dari data science pada e-commerce adalah melakukan hal-hal berikut
kecuali :
a. Prediction
potential problem
b. Recommending
Product
c. Identifying Consumers
d. Analyzing
Reviews
3. Peran/deskripsi
tugas dari Scientific database operator (D3 – S1) adalah :
a. Manages
daily operation of facilities and resources and responds to customer requests.
b. Manages
daily operation of cloud storage, including related to data life cycle, and
responds to requests from storage users
c. Designs
and implements or monitors and maintains large-scale cloud databases
d. Manages daily operation of scientific databases,
including related to data life cycle, and
responds to requests from database users.
4. Siklus
Hidup Sains Data pada Data Preparation adalah melakukan :
a. Searching
for different sources of data and capturing structured and unstructured data
b. Converting data into a common format
c. Gathering
information and deriving outcomes based on business requirements
d. Using
variables and equations to establish relationship
5. Profil
Profesional Sains Data tergolong keluarga pekerjaan (okupasi) terkait data.
Pekerjaan baru yang diusulkan ditemaptkan dalam empat kelompok klasifikasi
teratas adalah manager, professional madya dan kerja pendukung klerikal. Yang
termasuk professional adalah :
a. kurator
dan pengurus (stewards) data
b. CEO
c. Operator
dan Teknisi
d. Pengembang aplikasi dan insinyur/perekaya
infrastuktur
6. Komponen-kompone
dari Sains data pada DOMAIN KNOWLEDGE adalah, kecuali :
a. Highlight
important criteria
b. Easier
Explanation of technical concept
c. Designing Methods
d. Client
Requirement
7. Teknik
pada Machine Learning adalah, kecuali :
a. Improvenetal Learning
b. Reinforcement
Learning
c. Supervised
Learning
d. UnSupervised
Learning
8. Penerapan
utama data dari data science pada banking adalah melakukan hal-hal berikut
:
a. Drug
Discovery, Bioinfomatics, Maintenance Schedulling
b. Customer Segmentation, identifying
c. Monitoring
System, Maintenance System
d. Self
Driving Car, Car Monitoring System, Enhanced driving Experience, Enhanced the
safety of Passenger
9. Beda
Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki “has problem
solving skills, knowledge of basic statistic”. Hal tersebut ada pada fitur : a. Skill
b. Type
of Data
c. Background
d. Scope
10. Siklus
Hidup Sains Data pada Data Discovery adalah melakukan :
a. Searching for different sources of data and capturing
structured and unstructured data
b. Gathering
information and deriving outcomes based on business requirements
c. Converting
data into a common format
d. Using
variables and equations to establish relationship
11. Peran/deskripsi
tugas dari Business Analyst (S1) adalah :
a. Design
and maintains the architecture of data science applications and facilities
b. Analyses a large variety of data information system
for improving business performance.
c. Analyses
a large variety of data to extract information about system, service or
organization performance and presents them in usable/actionable form.
d. Design/develops/codes
large data analytics applications
12. Dalam
membangun Tim Sains Data, personil yang dibutuhkan pada tahap data analysis
adalah, kecuali :
a. Data
Analyst/Business Analyst
b. Researcher
c. Data
Scientist
d. Data
Science Application Developer
13. Task
seorang Data Scientist adalah :
a. Interpret and Manage data and solve complex problems
using expertise in a variety of data
niches
b. Develop
and initiate innovative statistical technique, issues and protocols
c. Analyst
data with specific statistical software and developing theory of statistics
d. To
provide new insights into business and create solutions that enable enhanced
business performances
14. Alur
proses Sains Data adalah :
a. Get
Data - Explore – Model Data – Stimulate Results – Visualize Result – Use
Result in business
b. Get
Data – model Data – Explore - Visualize Result - Stimulate Results - Use Result
in business
c. Get Data - Explore – Model Data – Visualize Result –
Stimulate Results - Use
Result in business
d. Get
Data - Explore – Visualize Result – Model Data – Stimulate Results - Use Result
in business
15. Penerapan
utama data dari data science pada banking adalah melakukan hal-hal berikut
kecuali :
a. DROP
b. Fraud
Detection
c. REVOKE
d. Virtual Assitants
16. Sains
data adalah multi disiplin dari:
a. Application
web, Application desktop
b. Datawarehouse,
Datamining
c. Statistical Model, Statistical Computing
d. Hardware,
Software
17. Responsibilities
seorang Data Scientist adalah :
a. Analyst
data with specific statistical software and developing theory of statistics
b. Interpret
and Manage data and solve complex problems using expertise in a variety of data
niches
c. Develop
and initiate innovative statistical technique, issues and protocols
d. To provide new insights into business and create
solutions that enable enhanced business
performances
18. Siklus
Hidup Sains Data pada Mathematical Models adalah melakukan :
a. Converting
data into a common format
b. Gathering
information and deriving outcomes based on business requirements
c. Searching
for different sources of data and capturing structured and unstructured data
d. Using variables and equations to establish
relationship
19. Definisi
Data Science dari NIST (2018) :
a. Data
science combines the scientific method, math and statistics
b. Data
science is an inter-disciplinary field that uses scientific methods,
processes,algorithms … in managing a digital data collection
c. Data
science is the field of study that combines domain expertise, programming
skills, and knowledge of mathematics and statistics to extract meaningful
insights from data
d. Data science is the extraction of useful knowledge
directly from data through a process of
discovery, or of hypothesis formulation and hypothesis testing
20. Siklus
Hidup Sains Data pada Getting things in action adalah melakukan :
a. Converting
data into a common format
b. Gathering information and deriving outcomes based on
business requirements
c. Using
variables and equations to establish relationship
d. Searching
for different sources of data and capturing structured and unstructured data
M2
21. Apa
kepanjangan CEP :
a. Campaign
Event Processing
b. Collaboration
Event Processing
c. Complex Event Processing
d. Communication
Event Processing
22. Berikut
kepanjangan dari ETL :
a. Example,
Transformation, Load
b. Extraction, Transformation, Load
c. Extraction,
Transaction, Load
d. Extraction,
Transformation, Listen
23. Berikut
tahapan layer pada proses ETL :
a. Row Layer, Gold Layer, Business Layer
b. Row
Layer, Business Layer, Gold Layer
c. Record
Layer, Row Layer, Gold Layer
d. Business
Layer, Row Layer, Gold Layer
24. Berikut
urutan yang tepat dalam proses dashboard development :
a. UAT
and Deployment, Detailed Requirement Gathering, Design, Development
b. Design,
Detailed Requirement Gathering, Development, UAT and Deployment
c. Development,
Detailed Requirement Gathering, Design, UAT and Deployment
d. Detailed Requirement Gathering, Design, Development,
UAT and Deployment
25. Berikut
yang merupakan query access :
a. Postgresql
dan Hive
b. HDFS
dan Hive
c. Hbase
dan Postgresql
d. Hive dan Phoenix
26. Berikut
tool yang tepat digunakan sebagai api gateway :
a. Hive
b. Kafka
c. Spark
d. Kong
27. Terdapat
3 komponen utama dalam memproses CEP :
a. Rule
b. Data Layer
c. Event
d. Dataset
28. Pada
proses realtime ingestion, tools yang digunakan sebagai message broker dalam
hal ini adalah : a. Krakend
b. Airflow
c. Zeppelin
d. Kafka
29. Tools
yang berfungsi sebagai tempat visualisasi dashboard dari hasil ETL : a. Hive
b. Superset
c. Kong
d. Zeppelin
30. Dalam
proses Detail Requirement Gathering terdapat prose :
a. Data Source Identification
b. UAT
dengan customer
c. Deployment
dan operation monitoring
d. ETL
Development
31. Deployment dan
operation monitoring terdapat
pada tahap … pada proses
development:
a. Detailed
Requirement Gathering
b. Development
c. Deployment
d. Design
32. Campaign
dapat dikirim melalui berbagai channel seperti berikut, kecuali :
a. Notifikasi
Apps
b. Ditelphone
c. SMS
d. Email
33. Apa
saja poin penting dalam big data, kecuali :
a. Volume
b. Variety
c. Velocity
d. Vacility
34. Yang
bukan termasuk proses dalam tahap development adalah :
a. Dashboard
Development
b. System
Integration Test (SIT)
c. Data Source Identification
d. ETL
Development
35. Dalam
proses Cep, Debezium berfungsi sebagai :
a. Tempat
penyimpanan setiap event yang masuk
b. Melakukan
evaluasi setiap event terhadap rule yang tersedia
c. Mengirim
campaign yang telah dievaluasi kepada customer
d. Change Data Capture, atau membaca setiap perubahan
yang terjadi pada database
36. Berikut
contoh penggunaan database pada lingkungan big data, kecuali :
a. Postgresql
b. Exel
c. Hdfs
d. Druid
37. Dalam
hal evaluasi CEP, tools yang dapat bertindak sebagai API gateway adalah : a. Hbase
b. Spark
c. Debezium
d. Kong
38. Tools
yang berfungsi sebagai process scheduler :
a. Hive
b. Kafka
c. Kong
d. Airflow
39. CEP
merupakan produk campaign marketing yang mengirim campaign secara : a. Realtime
b. Scheduling
c. Batch
d. Random
40. Prinsip
kerja dari CEP dalam mengirim sebuah campaign adalah secara :
a. Batch
dan general
b. Batch
dan personalize
c. Realtime dan personalize
d. Random
dan general
M3
41. Untuk
pengujian model pada Pengujian Model Data Mining adalah :
a. Data
validation
b. Data
training
c. Data
estimation
d. Data testing
42. Beberapa
definisi data mining adalah, kecuali :
a. Extraction
of interesting (non-trivial, implicit, previously unknown and potentially
useful) patterns or knowledge from huge amount of data
b. Searching for different sources of data and capturing
structured and unstructured data
c. Kegiatan
yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan,
pola dan hubungan dalam set data berukuran besar
d. Melakukan
esktraksi untuk mendapatkan informasi penting yang sifatnya implisit dan
sebelumnya tidak diketahui, dari suatu data
43. Evolusi
Science (Evolution of Sciences) sebelum tahun 1600 adalah :
a. Theoretical
science
b. Computational
science
c. Empirical science
d. Data
science
44. Evolusi
Science (Evolution of Science) tahun 1950-1990 adalah :
a. Theoretical
science
b. Computational science
c. Empirical
science
d. Data
science
45. Rapidminer
adalah :
a. Designs
and implements or monitors and maintains large-scale cloud databases
b. Software data mining dan data analytics
c. Manages
daily operation of facilities and resources and responds to customer requests
d. Manages
daily operation of cloud storage, including related to data life cycle, and
responds to requests from storage users
46. Evolusi
Science (Evolution of Sciences) tahun 1600-1950 adalah :
a. Theoretical science
b. Empirical
science
c. Computational
science
d. Data
science
47. Peran
utama data mining adalah sebagai berikut, kecuali :
a. Penentuan
b. Prediksi
c. Estimasi
d. Klastering
48. Linear
Regression, Neural Network, Support Vector Machine adalah algoritma pada …
didata mining:
a. Classification
b. Clustering
c. Estimasi
d. Association
49. Pembagian
Dataset pada Pengujian Model Data Mining adalah kecuali:
a. Data
validation
b. Data estimation
c. Data
training
d. Data
testing
50. Untuk
pembentukan model pada Pengujian Model Data Mining adalah :
a. Data
estimation
b. Data training
c. Data
validation
d. Data
testing
51. Evolusi
Science (Evolution of Sciences) tahun 1990 - now adalah :
a. Theoretical
science
b. Computational
science
c. Empirical
science
d. Data science
52. Fakta
yang terekam dan tidak membawa arti adalah definisi dari:
a. Informasi
b. Sistem
c. Pengetahuan
d. Data
53. Metode
data mining yang menggunakan data dengan label dan tidak berlabel sekaligus
dalam proses pembelajarannya adalah : a. Unsupervised Learning
b. Supervised
Learning
c. Type
of Data
d. Semi-Supervised Learning
54. Data
cleaning, Data Integration, Data Reduction, Data Transformation adalah proses
… pada Data mining :
a. Data Pre-processing
b. Data
Scientist
c. Data
Analyst/Business Analyst
d. Data
Science Application Developer
55. Pola,
rumus, aturan atau model yang muncul dari data adalah definisi dari: a. Data
b. Informasi
c. Pengetahuan
d. Sistem
56. Definisi
Unsupervised Learning adalah, kecuali :
a. Variable
(atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
b. Algoritma
data mining mencari pola dari semua variable (atribut)
c. Algoritma
clustering adalah algoritma unsupervised learning
d. Sebagian besar algoritma data mining (estimation,
prediction/forecasting, classification)
adalah supervised learning
57. FP-growth,
A Priori, Coefficient of Correlation, Chi Square adalah algoritma pada … didata
mining :
a. Association
b. Clustering
c. Classification
d. Estimasi
58. Algoritma
association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang
:
a. Bioinformatics
b. Customer
Segmentation
c. Muncul Bersamaan
d. Monitoring
System
59. Contoh
Penerapan Data Mining adalah sebagai berikut, kecuali :
a. Penetuan
pasokan listrik PLN untuk wilayah Jakarta
b. Penjadwalan pemeliharaan
c. Analisis
pola belanja pelanggan
d. Deteksi
serangan (intrusion) pada suatu jaringan
60. Definisi
Supervised Learning adalah, kecuali :
a. Variable (atribut) yang menjadi target/label/class
tidak ditentukan (tidak ada)
b. Sebagian
besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning
c. Algoritma
melakukan proses belajar berdasarkan nilai dari variabel target yang
terasosiasi dengan nilai dari variable predictor
d. Pembelajaran
dengan guru, data set memiliki target/label/class
61. Graf
tidak berarah dimana antara dua simpul terhubung oleh hanya satu jalur (tidak
terdapat siklus) adalah: a. Regular
b. Hutan
(Forest)
c. Pohon (Tree)
d. Asiklik
(acyclic)
62. Ukuran
terkait kekuatan dalam jaringan yang menunjukkan simpul mana yang berperan
dalam sebagai perantara, yaitu seberapa sering sebuah simpul dilalui oleh
lintasan terpendek adalah:
a. Sentralitas
Eigenvector
b. Kedekatan
sentralitas
c. Derajat
sentralitas
d. Sentralitas keantaraan
63. Pseudo
Graf adalah:
a. Graf
yang tidak memiliki loop sendiri tetapi terdapat ruas yang parallel
b. Graf yang memiliki loop sendiri tetapi tidak ada ruas
yang paralel
c. Graf
memiliki derajat yang sama
d. Graf
terhubung dimana semua simpul berderajat genap
64. Graf
yang hanya memiliki 1 simpul adalah:
a. Graf
tidak terhubung
b. Graf semu (trivial)
c. Graf
hampa
d. Graf
terhubung
65. Graf
yang tak berarah, tak terhubung atau dengan kata lain kumpulan pohon yang tidak
saling terhubung adalah:
a. Hutan (Forest)
b. Regular
c. Asiklik
(acyclic)
d. Pohon
(Tree)
66. Algoritma
untuk pohon rentang minimum adalah:
a. Semua
jawaban salah
b. Algoritma
djikstra
c. Algoritma Kruskal
d. Algoritma
perjalanan salesman
67. Graf
yang memiliki simpul tetapi tidak memilik ruas disebut:
a. Graf
terhubung
b. Graf
tidak terhubung
c. Graf hampa
d. Graf
semu (trivial)
68. Istilah
lain untuk simpul pada graf adalah:
a. Edge
b. Lintasan
c. Ruas
d. Vertex
69. Panjang
Lintasan (Path) adalah:
a. Himpunan
Simpul
b. Jumlah ruas yang terhubung pada simpul tersebut
c. Penghubung
antar simpul
d. Jumlah
lintasan dari satu simpul ke simpul lain
70. Graf
dimana terdapat siklus dari sebuah simpul yang mengunjungi setiap simpul dalam
graf tepat satu kali disebut dengan: a. Graf
Hamilton
b. Graf
Euler
c. Graf
bipartite
d. Graf
plannar
71. Apakah
yang dimaksud dengan Derajat pada graf:
a. Himpunan
Simpul
b. Jumlah
lintasan dari satu simpul ke simpul lain
c. Jumlah ruas yang terhubung pada simpul tersebut
d. Penghubung
antar simpul
72. Ukuran
terkait kekuatan dalam jaringan yang menunjukkan seberapa penting orang/pihak
lain yang mempunyai jaringan dengan actor (simpul) adalah:
a. Kedekatan
sentralitas
b. Sentralitas
keantaraan
c. Sentralitas Eigenvector
d. Derajat
sentralitas
73. Jenis
Graf apakah yang antara setiap pasang simpul terdapat minimum satu jalur: a. Graf
semu (trivial)
b. Graf
hampa
c. Graf
tidak terhubung
d. Graf terhubung
74. Apakah
yang dimaksud dengan Ruas Paralel dalam graf:
a. Jika terdapat lebih dari satu ruas antara dua simpul
yang bersebelahan
b. Sebuah
ruas dari dan ke satu simpul
c. Sebuah
Graf dengan jumlah simpul dan ruas yang berhingga
d. Graf
memiliki derajat yang sama
75. Graf
yang dapat dibentuk pada sebuah bidang sedemikian sehingga tidak terdapat dua
ruas yang saling bersilangan adalah: a. Graf bipartite
b. Graf
Hamilton
c. Graf
Euler
d. Graf plannar
76. Ruas
adalah :
a. Himpunan
Simpul
b. Jumlah
lintasan dari satu simpul ke simpul lain
c. Jumlah
yang terhubung pada simpul tersebut
d. Penghubung antar simpul
77. Multi
Graf adalah:
a. Graf
memiliki derajat yang sama
b. Graf
yang memiliki loop sendiri tetapi tidak ada ruas yang paralel
c. Graf yang tidak memiliki loop sendiri tetapi terdapat
ruas yang paralel
d. Graf
terhubung dimana semua simpul berderajat genap
78. Himpunan
ruas yang dapat membagi graf G menjadi dua sub-graf S dan T disebut dengan:
a. cyclic
(siklik)
b. Himpunan pemotong (cut set)
c. Lintasa
d. Derajat
79. Siapakah
ilmuwan penemu Teori Graf :
a. Blaise
Pascal
b. Leonhard Euler
c. Bill
Gates
d. Dennis
Ritchie
80. Jenis
Graf apakah dimana terdapat dua simpul yang tidak memiliki jalur yang
menghubungkan ke dua simpul tersebut: a. Graf semu (trivial)
b. Graf
terhubung
c. Graf tidak terhubung
d. Graf
hampa
81. Tahapan
Feature Extraction pada NLP adalah:
a. Vector Space Model
b. Text
Similarity
c. Tokenization
d. Sequential
Labeling
82. Disebut
apakah jenis ambiguitas dari satu kata:
a. Ambiguitas
Semantik
b. Ambiguitas Leksikal
c. Ambiguitas
Anaforis
d. Ambiguitas
Sintaksis
83. Pernyataan
berikut ini adalah keuntungan dari NLP:
a. Sistem
NLP terkadang tidak memiliki antarmuka pengguna
b. Akurasi jawaban meningkat dengan jumlah informasi
relevan yang diberikan dalam pertanyaan
c. Tidak
dapat beradaptasi dengan domain dan masalah baru karena fungsinya yang terbatas
d. Bahasa
Query Kompleks
84. Masalah
yang terdapat pada disiplin Psikolinguis adalah:
a. Bagaimana
frase dan kalimat dapat dibentuk dengan kata-kata?
b. Bagaimana manusia dapat mengidentifikasi struktur
kalimat?
c. Bagaimana
kata dan kalimat mendapatkan maknanya?
d. Bagaimana
pengetahuan dan penalaran dapat dimodelkan?
85. Mobil
menabrak tiang saat sedang melaju adalah contoh dari ambiguitas:
a. Ambiguitas
Leksikal
b. Ambiguitas
Sintaksis
c. Ambiguitas Semantik
d. Ambiguitas
Anaforis
86. Berikut
ini tekhnik pemrosesan bahasa alami umum yang merupakan Grammar Correction
adalah:
a. Meringkas
informasi penting dari suatu sumber untuk menghasilkan versi yang dipersingkat
b. Google,
Yahoo, Bing
c. Ketik
kata kunci untuk mengajukan pertanyaan
d. Koreksi ejaan dan tata Bahasa
87. Startup
NLP di Indonesia yang menjadikan conversational AI dengan chatbot sebagai
produk utama mereka adalah... a. Kata.ai dan
Bahasa.ai
b. Prosa.ai dan Bahasa.ai
c. Prosa.ai
d. Prosa.ai
dan Kata.ai
88. Berikut
ini adalah contoh dari pengkategorian teks kecuali:
a. Translation
b. Essay
Scoring
c. Sentiment
Analysis
d. Spam
Filtering
89. Berikut
ini yang bukan domain Computational Linguistics adalah:
a. Bagaimana
mempelajari Bahasa
b. Bagaimana
memahami Bahasa
c. Bagaimana
menghasilkan Bahasa
d. Menyelesaikan practical problem yang melibatkan
Bahasa manusia
90. Dasar
pemrosesan teks dari berbagai NPL task adalah sebagai berikut, kecuali:
a. Pengektraksian
Informasi
b. Tokenisasi
c. Mengkategorisasi
teks
d. Mengklasifikasi
teks
91. Startup
NLP di Indonesia yang menyediakan layanan text berupa Prosa Text API adalah:
a. Kata.ai
b. Veronica
c. Bahasa.ai
d. Prosa.ai
92. Sistem
penulisan apakah dimana simbol individu mewakili suku kata: a. Silabis
b. Abjad
c. Grafik
d. Logografik
93. Masalah
yang terdapat pada disiplin Ahli bahasa adalah:
a. Bagaimana
manusia dapat mengidentifikasi struktur kalimat?
b. Bagaimana
kata dan kalimat mendapatkan maknanya?
c. Bagaimana frase dan kalimat dapat dibentuk dengan
kata-kata?
d. Bagaimana
pengetahuan dan penalaran dapat dimodelkan?
94. Pernyataan
berikut ini adalah kerugian dari NLP:
a. Sistem ini dibangun untuk satu tugas dan spesifik
saja
b. Sistem
NLP memberikan jawaban atas pertanyaan dalam bahasa alami
c. Sistem
NLP menawarkan jawaban yang tepat untuk pertanyaan, tidak ada informasi yang
tidak perlu atau tidak diinginkan
d. Pengguna
dapat mengajukan pertanyaan tentang subjek apa pun dan mendapatkan tanggapan
langsung dalam hitungan detik
95. Perbedaan
utama antara Bahasa Alami dan Bahasa Komputer dengan parameter Literalness
adalah:
a. Bahasa alami terbuat dari idiom dan metafora,
sedangkan Bahasa Komputer merupakan
bahasa formal memiliki arti yang persis seperti yang ingin mereka katakana
b. Bahasa
Alami bersifat ambigu, sedangkan bahasa komputer dirancang untuk tidak ambigu
c. Bahasa
Alami menggunakan banyak redundansi, sedangkan Bahasa Komputer adalah Bahasa
formal tidak terlalu berlebihan
d. Tidak
ada jawaban yang tepat
96. Pemrosesan
Bahasa Alami (NLP)menurut Goldberg adalah:
a. Bidang perancangan metode dan algoritma yang
mengambil sebagai masukan atau menghasilan
sebagai keluaran, data bahasa alami tidak terstruktur
b. Metode
untuk menyelesaikan prac- tical problem yang melibatkan Bahasa manusia
c. Desain
dan analisis algoritma komputasi dan representasi untuk memproses bahasa alami
manusia
d. Bidang
yang mempelajari metode, algoritma, representasi yang memproses input ataupun
output yang berupa Bahasa alami, baik berupa teks maupun suara
97. Tahapan
NLP apakah dimana tujuan dari tahap ini adalah untuk memecah potongan input
bahasa menjadi kumpulan token yang sesuai dengan paragraf, kalimat, dan kata:
a. Analisis
sintaks
b. Analisis
pragmatis
c. Pengolahan morfologi
d. Analisis
semantic
98. Fase
NLP yang merupakan fase akhir tahun 1960-an hingga akhir 1970-an dicirikan
dengan:
a. Pekerjaan
yang dilakukan dalam fase ini difokuskan terutama pada Mesin
Penerjemah
b. Mendapat
beberapa sumber daya & alat praktis seperti parser, misalnya Alvey
Natural Language Tools bersama dengan sistem yang lebih operasional dan
komersial, misalnya untuk kueri database.
c. Pekerjaan yang dilakukan sebagian besar terkait
dengan pengetahuan dunia dan perannya
dalam konstruksi dan manipulasi representasi makna.
d. Pendekatan
leksikalisasi tata bahasa dan menjadi pengaruh yang meningkat
99. Sub-bidang
Ilmu Komputer khususnya Artificial Intelligence (AI) yang berkepentingan untuk
memungkinkan komputer memahami dan memproses bahasa manusia, adalah: a. Natural Languange Processing (NLP)
b. Computer
Vision
c. Expert
System
d. Image
Processing
100.Tahapan
Preposesing pada NLP adalah:
a. Text Similarity
b. Tokenization
c. Vector
Space Model
d. Sequential
Labeling
101. Struktur
matematika paling dasar dari suatu grafik adalah :
a. Banyaknya
Set V
b. Satu set V yang terhubung melalui garis E
c. Banyaknya
garis E
d. Banyaknya
Network
102. Riset
tentang network analisis ditemukan pada bidang ilmu :
a. Data
science
b. Computational
science
c. Theoretical
science
d. Educational psychology
103. Menurut
Halgin & DeJordy, 2008 “If your research question is about different
patterns of interaction within defined groups” adalah : a. Sociocentric
b. Egocentric
c. Anthropologie
d. Physiocentric
104. Gephi
adalah software social network analysis, kecuali :
a. Free
b. Open
Source
c. Berbayar
d. Interactive
visualization and exploration
105. Keuntungan
dari social network analysis adalah:
a. Berfokus
pada node
b. Berfokus
pada jaringan
c. Berfokus
pada edge
d. Berfokus pada interaksi
106. Closeness
Centrality adalah :
a. Ukuran
sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur terdekat
yang melewatinya.
b. Ukuran sentralitas suatu node yang dihitung
berdasarkan rerata jarak terdekat antar
node
c. Ukuran
sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah garis
penghubung (edge) yang menyambung beberapa node
d. Ukuran
terbentuknya jaringan pada grafik
107. Software
Social Network Analysis adalah :
a. Twitter
b. RapidMiner
c. NodeXL dan Gephi
d. Linux
dan Windows
108. Beberapa
disiplin ilmu dari Social Network Analysis adalah, kecuali :
a. Graf network
b. Transportation
network
c. Social
network
d. Electrical
network
109. Tipe
dari social network analysis yang “Whole network”
a. Egocentric
b. Anthropologie
c. Physiocentric
d. Sociocentric
110. Sejarah
network analysis pada tahun … New York Times reported on the new science of
“psychological geography” : a. 1950
b. 1960
c. 1933
d. 1930
111. Social
Network Analysis adalah :
a. Studi
sociometri
b. Sebuah studi
yang mempelajari
tentang hubungan manusia dengan memanfaatkan teori graf
c. Metode
yang menghubungkan antar node
d. Peta
yang terdiri atas banyak orang dimana di dalamnya terdapat relasi antar
individunya
112. Menurut
Halgin & DeJordy, 2008 “If your research question is about phenomena of or
affecting individual entities across different settings” adalah :
a. Egocentric
b. Sociocentric
c. Anthropologie
d. Physiocentric
113. Betweenness
Centrality adalah :
a. Ukuran
sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah garis
penghubung (edge) yang menyambung beberapa node
b. Ukuran
terbentuknya jaringan pada grafik
c. Ukuran
sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat antar
node
d. Ukuran sentralitas suatu node dalam suatu jaringan
berdasarkan jumlah jalur terdekat yang
melewatinya.
114. Network
analysis dibangun dari :
a. Sociology
b. Political
c. Communication
d. Economy
115. Edge
adalah :
a. Koneksi
antara banyak node
b. Koneksi
antara lebih dari dua buah node
c. Koneksi
antara dua buah jaringan
d. Koneksi antara dua buah node
116. Tipe
dari social network analysis yang “Creates many stand alone network”:
a. Anthropologie
b. Physiocentric
c. Egocentric
d. Sociocentric
117. Tipe
dari social network analysis yang “Creates one network”:
a. Anthropologie
b. Sociocentric
c. Egocentric
d. Physiocentric
118. NodeXL
adalah software social network analysis yang, kecuali
a. Menggunakan
template excel
b. Open
source
c. Menggunakan template word
d. Free
119. Degree
Centrality adalah :
a. Ukuran
terbentuknya jaringan pada grafik
b. Ukuran
sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur terdekat
yang melewatinya
c. Ukuran sentralitas suatu node dalam sebuah jaringan
yang diukur dari jumlah garis penghubung
(edge) yang menyambung beberapa node
d. Ukuran
sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat antar
node
120. Tipe
dari social network analysis yang “Personal network”:
a. Egocentric
b. Sociocentric
c. Physiocentric
d. Anthropologie
121.is a form of qualitative
analysis that is concerned with more than just statistics and numerical values.
a. Analysis
b. Analysis
c. Analysis
d. Text analysis
122.focuses on the process of turning
raw data into useful statistics, information, and explanations.
a. Information
System
b. Information
c. Data
d. Data analysis
123.
Text analysis tools can sort text by :
a. Read
for information
b. Topic
c. Extract
information
d. Extract
data
124.
Sentiment = feelings, kecuali :
a. Emotions
b. Soul
c. Opinions
d. Attitudes
125.recognizing opinion – oriented questions.
a. Information
extraction
b. Question answering
c. Bias
identifications
d. Summarization
126.A powerful analytics and data
visualization perform. Connect all your data and create interactive dashboards
that update in real-timey.
a. R
b. Tableau
c. Phyton
d. rapidMiner
127.discarding subjective information.
a. Question
answering
b. Bias
identification
c. Summarization
d. Information extraction
128. Application
from SA have been useful in other areas, kecuali :
a. Entertainment
b. Law/policy
making
c. Politics/political
science
d. Sociology
129. Traditional
bullying was limited to …. :
a. Floral
b. Schools and youth crowds
c. Animal
d. Staff
130. …..
for data analytics teams that want to tackle challenge tasks and handle large
amounts of data.
a. Microsoft
Excel
b. RapidMiner
c. KNIME
d. Phyton
131. Process
of cleaning, analyzing, interpreting, and visualizing data to discover valuable
insights that drive smarter and more effectives business decisions is ….. :
a. Data
b. Data analysis
c. Information
d. Information
system
132.bullying with the use of digital technology.
a. Cyberbullying
b. Electronicbully
c. Bullying
d. Ebully
133.filter, organize, and visualize
quantitative data. The perfect tool for performing simple data analysis. Explore
common functions and formulas for data analysis.
a. KNIME
b. Microsoft Excel
c. Phyton
d. RapidMiner
134. …..
the preferred programming language for machine learning. Use it to build data
analysis solutions for various use cases.
a. Microsoft
Excel
b. KNIME
c. RapidMiner
d. Phyton
135. …..
open-source platform for building advanced machine learning solutions, and
visualizing data. :
a. Microsoft
Excel
b. Phyton
c. KNIME
d. RapidMiner
136.accounting for multiple viewpoints.
a. Information
extraction
b. Question
answering
c. Bias
identification
d. Summarization
137.used to analyze data and sort it as
positive, negative, or neutral to gain in-depth knowledge about how customers
feel towards each aspect.
a. Data
analysis
b. System
analysis
c. Sentiment analysis
d. Information
analysis
138. Sentiment
analysis, also called :
a. Opinion Mining
b. Appraisals
c. Sentiment
Mining
d. Opinion
Data
139. Some
sentiment analysis jargon :
a. Collaboration
b. Analysis
c. Semantic orientation
d. Collection
140. Contoh
pertanyaan pada sentiment analysis:
a. Is this product review positive or negative?
b. How
to produce product ?
c. How
many node in graph?
d. Is
far or close ?
141. Berikut
ini merupakan toolkit data mining bersifat open source yang dapat digunakan
untuk visualisasi data, machine learning serta memiliki pemrograman visual
untuk analisis data kualitatif yang cepat, eksploratif dan interaktif:
a. Hive
b. Kafka
c. Orange
d. Nifi
142. Program
database apakah yang digunakan untuk data & statistic pada knowledge
explorer Indonesia OneSearch (IOS)?
a. API
b. MySQL
c. Apache
SOLR
d. MongoDB
143. Text
information, segmentation and tokenization, text cleaning, vectorization and
feature engineering, text lemmatization and stemming, machine learning
algorithms, dan result interpretation adalah tahapan dari
a. NLP pipeline
b. Phyton
c. Setiment
analysis
d. Big
data analysis
144. Big
data dapat membantu melakukan predictive maintenance & quality pada
industri a. Automotive
b. Education
c. Banking
d. Agriculuture
145. Sebuah
sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan platform
online yang berbasis teknologi big data menggunakan keahlian artificial
intelligence dan natural learning process (NPL) adalah
a. Drone emprit
b. Corpus
c. Data
science
d. Social
network analysis
146. Bidang
yang terkait dengan studi, desain dan pengembangan Teknik untuk mengesktrak
unit leksikal dari teks dan pemfilteran unit leksikal melalui beberapa skema
penilaian dan peringkat, yang digunakan untuk identifikasi istilah disebut
a. Named Entity Recognition (NER)
b. Syntax
Analysis (S-P-O)
c. Automatic
Term Recognition (ATR)
d. Part-Of-Speech
(POS) Tagging
147. Pada
grafik perkembangan data dari tahun 2010 hingga 2020, data terbanyak bersumber
dari area berikut kecuali
a. Social
media
b. Sensors
& Devices
c. Enterprise
Data
d. Exabytes Volume
148. Berikut
ini adalah sumber data yang digunakan pada knowledge explorer Indonesia
onesearch (IOS), kecuali:
a. Berita
online
b. iTunes
c. Blog
d. Jurnal
149. Ilustrasi
hubungan subyek dan obyek yang saling berhubungan melalui predikat dapat
dilihat menggunakan
a. Tree-map
b. Directed graph
c. Undirected
graph
d. Co-occurance
150. Berikut
ini adalah 3 kriteria big data sederhana
a. Visibility,
value, velocity
b. Volume,
veracity, variety
c. Visibility,
variety, veracity
d. Volume, velocity, variety
151. NLP
digunakan dalam hal-hal berikut kecuali:
a. Trends
Analysis
b. Sentiment
Analysis
c. Quote
extraction
d. Text-to-speech extraction
152. Sebagian
besar data yang semakin bertambah berupa
a. Balanced
data
b. Unstructured data
c. Enterprise
data
d. Structured
data
153. Berikut
adalah manfaat Co-occurance kecuali
a. Menunjukkan
actor yang ada dalam paragraph yang sama
b. Menampilkan
actor penting yang sering muncul bersamaan
c. Identifikasi jenis korelasi antar pelaku dan istilah
d. Indikasi
adanya korelasi antar pelaku dan istilah
154. SparkNLP
dapat melakukan hal berikut kecuali
a. Stemming
b. Actor recognition
c. Sentiment
detector
d. Tokenization
155. Proses
NLP yang mengacu pada pengategorian kata-kata dalam teks (korpus) tergantung
pada definisi kata dan konteksnya disebut sebagai
a. Named
Entity Recognition (NER)
b. Syntax
Analysis (S-P-O)
c. Automatic
Term Recognition (ATR)
d. Part-Of-Speech (POS) Tagging
156. NLP
pada sistem factminer mendapatkan masukkan dari hal berikut, kecuali
a. Laporan
internal
b. Dokumen
Berita online
d. Semantic
search engine
157. Text
mining language yang paling popular adalah
a. HTML
dan KNIME
b. Phyton
dan NLP
c. Phyton dan R
d. NLP
dan Java
158. Selain
tokoh dan organisasi, dalam suatu berita FactMiner dapat mengekstrak data
berikut kecuali
a. Peristiwa
b. Komentar
c. Waktu
d. Lokasi
159. Suatu
Teknik yang secara otomatis mengidentifikasi entitas tertentu dalam teks dan
mengklasifikasikannya ke dalam kategori yang telah ditentukan sebelumnya
disebut
a. Named Entity Recognition (NER)
b. Part-Of-Speech
(POS) Tagging
c. Automatic
Term Recognition (ATR)
d. Syntax
Analysis (S-P-O)
160. Sebuah
tree-map dapat digunakan mengidentfikasi untuk hal berikut kecuali:
a. Hubungan antar subjek
b. Aktifitas
terkait dengan actor
c. Obyek
atau entitas terkait aktivitas subyek
d. Aktor
perorangan, organisasi, konsep (subyek)
161. Definisi
kampanye menurut rogers dan storey adalah:
a. Penggunaan
berbagai metode komunikasi yang berbeda secara terkoordinasi dalam jangka waktu
tertentu yang ditujukan untuk mengarahkan khalayak pada masalah tertentu dan
solusinya
b. Penciptaan
Kembali dan pemindahan simbol-simbol penting secara terus menerus melalui
komunikasi
c. Serangkaian Tindakan komunikasi yang direncanakan
dengan tujuan menciptakan efek tertentu
pada sejumlah besar khalayak yang dilakukan secara berkelanjutan selama periode waktu tertentu
d. Proses
rangkaian komunikasi politik antara kontestan politik dan pemilih
162. Elemen
dibawah ini tidak diperhitungkan dalam metrik GRP sosial:
a. Effective
reach
b. Relevant
Audience relevance
d. Sentiment
163. Model
prediktif kampanye politik menghasilkan tiga kategori “skor prediktif”, kecuali
a. Skor elektabilitas
b. Skor
respons
c. Skor
dukungan
d. Skor
perilaku
164. Pembersihan
data ini dimulai dari awal saat data pertama kali diambil dan melibatkan semua anggota
tim yang menyentuh data titik mana pun, merupakan tahapan dalam: a. Data hygienists
b. Data
explorers
c. Business
solution architects
d. Data
scientists
165. Berikut
ini bukan termasuk dalam faktor yang mempengaruhi kampanye politik:
a. Kebijakan
politik panitia pemilihan
b. Perkembangan
teknologi
c. Perkembangan media cetak
d. Kemunduran
partai politik
166. Berikut
adalah pernyataan yang tidak benar mengenai heatmap:
a. Heatmap
dapat digunakan menilai kekuatan dan kelemahannya dalam menggunakan big data di
semua area fungsional
b. Heatmap
adalah Teknik visuaalisasi data yang menunjukkan besarnya suatu fenomena
sebagai warna dalam dua dimensi
c. Heatmap
membantu perusahaan mengidentifikasi dan memprioritaskan peluang untuk
investasi
d. Heatmap memberikan panduan harga pada tingkat
transaksi individual
167. GRP
(Gross Rating Point) sosial media digital dibagi menjadi tiga.
a. Data
hygienists, data explorers, business solution architects
b. Skor
perilaku, skor dukungan, skor respons
c. Milik anda (misalnya situs web anda), berbayar (iklan
spanduk yang anda beli di situs lain),
diperoleh (posting atau komentar orang melalui blog atau tweet)
d. Effective
reach, audience relevance, sentiment
168. Otomatisasi
dilakukan untuk mengubah data menjadi laba, apakah yang dilakukan pada otomatisasi
ini:
a. Membuat replikasi dan perubahan analisis lebih mudah
sehingga tidak perlu selalu memulai dari
awal
b. Mengungkapkan
apa yang mendorong harga untuk setiap segmen pelanggan dan produk
Mengembangkan seperangkat komunikasi yang jelas untuk
memberikan alasan harga untuk menonjolkan nilai dan menyesuaikan argumen
tersebut dengan pelanggan
d. Mendukung tenaga penjualan dengan target yang bermanfaat
169. Peran
data hygienists adalah:
a. Mengambil
data terorganisir dan membuat model analitik canggih
b. Mengumpulkan
data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis
c. Memastikan bahwa data yang masuk ke sistem bersih dan
akurat, dan tetap seperti itu selama
siklus hidup data
d. Menyaring
kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
170. Berikut
ini adalah keefektifan dari customer lifecycle managemen, kecuali:
a. Dapatkan
pelanggan baru
b. Kembangkan
pelanggan yang sudah ada
c. Pertahankan
pelanggan yang sudah ada dan menangkan Kembali pelanggan lama
d. Mengubah model menjadi hasil
171. Skor
prediktif yang memprediksi bagaimana warga akan menanggapi penjangkauan
kampanye adalah:
a. Skor
perilaku
b. Skor
dukungan
c. Skor
elektabilitas
d. Skor respons
172. Memprediksi
perilaku pelanggan dan memungkinkan segmentasi pelanggan tingkat lanjut dan
pengoptimalan harga adalah tahapan dalam:
a. Data
explorers
b. Data scientists
c. Business
solution architects
d. Data
hygienists
173. Peran
data scientist adalah:
a. Memastikan
bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama
siklus hidup data
b. Menyaring
kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
c. Mengambil data terorganisir dan membuat model
analitik canggih
d. Mengumpulkan
data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis
174. Peran
business solution architects adalah:
a. Mengumpulkan data yang ditemukan dan mengaturnya
sehingga siap untuk dianalisis
b. Mengambil
data terorganisir dan membuat model analitik canggih
c. Menyaring
kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
d. Memastikan
bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama
siklus hidup data
175. Peran
data explorers adalah:
a. Menyaring kumpulan data untuk menemukan data yang
sebenarnya dibutuhkan
b. Memastikan
bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama
siklus hidup data
c. Mengubah
model menjadi hasil
d. Mengumpulkan
data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis
176. Skor
prediktif yang memprediksi preferensi politik warga adalah:
a. Skor dukungan
b. Skor
respons
c. Skor
elektibilitas
d. Skor
perilaku
177. Menyusun
data untuk memastikannya dapat ditanyakan secara berguna dalam kerangka waktu
yang sesuai oleh semua pengguna adalah tahapan dalam:
a. Data
hygienists
b. Data
scientists
c. Data
explorers
d. Business solution architects
178. Skor
prediktif yang menggunakan perilaku masa lalu dan informasi demografis untuk menghitung
probabilitas eksplisit bahwa warga negara akan terlibat dalam bentuk aktivitas
politik tertentu adalah:
a. Skor perilaku
b. Skor
elektibilitas
c. Skor
dukungan
d. Skor
respons
179. Peran
campaign experts adalah:
a. Mengumpulkan
data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis
b. Menyaring
kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
c. Mengubah model menjadi hasil
d. Memastikan
bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama
siklus hidup data
180. Apakah
quality function deployment (QFD) itu:
a. Pola
dalam analisis menunjukkan peluang untuk penetapan harga yang berbeda pada tiap
tingkat produk per pelanggan berdasarkan kesediaan untuk membayar b. Teknik
visualisasi data yang menunjukkan besarnya suatu fenomena sebagai warna dalam
dua dimensi
c. Teknik dari desain produk yang menerjemahkan
kebutuhan pelanggan ke dalam rekayasa
karakteristik
d. Teknik
untuk mengatasi kesenjangan komunikasi antara anggota fungsional yang berbeda
dalam suatu tim
181. Analisa
yang berdasarkan pada data-data mengenai harga historis yang terjadi pada pasar
saham, disebut:
a. Analisis fundamental
b. Analisis
kredit
c. Analisis
keranjang pasar
d. Analisis
teknikal
182. Praktik
illegal dalam dunia investasi, di mana seorang investor mendapat informasi yang
pasti perihal peluang keuntungan dalam transaksi jual beli saham. Kepastian
informasi tersebut tentu bersumber dari orang dalam di perusahaan terkait,
disebut : a. Bribery
b. Insiden
trading
c. Money laundring
d. Sanction
breaches
183. Data
warehouse DJP dapat berupa data-data, kecuali
a. Direct
tax
b. Data tradisional
c. Indirect
tax
d. Transfer
pricing
184. Berikut
adalah karakteristik big data, kecuali:
a. Variety
b. Capacity
c. Velocity
d. Volume
185. Berikut
merupakan contoh data konvensional
a. Data
stocks (saham)
b. Data laporan keuangan perusahaan
c. Data
social media (twitter, facebook, youtube, dll)
d. Data
transaksi nasabah bank
186. Di
dalam perpajakan ada yang disebut dengan self assessment system, apa yang
dimaksud self assessment system
a. Peranan
pemerintah sangat aktif dalam menentukan penerimaan pajak
b. Wajib pajak punya otomatis penuh aktif dalam
menjalankan kewajiban perpajakannya
c. Pihak
lain yang melakukan semua kewajiban perpajakan
d. Pemerintah
Bersama dengan wajib pajak aktif melaksanakan hak dan kewajiban perpajakan
187. Metode
ini merupakan metode eksplorasi yang mengubah data yang sangat besar menjadi
pohon keputusan yang mempresentasikan suatu aturan, disebut :
a. Chi-squared
automatic interaction detection (CHAID)
b. Classification and regression tree (CART)
c. Neural
network
d. Multivariate
adaptive regression spline (MARS)
188. Jenis
fraud yang korban terbesarnya adalah para pemegang sahan, adalah :
a. Investment scam
b. Customer
fraud
c. Management
fraud
d. Employee
fraud
189. Tools
yang dapat digunakan untuk mengolah big data adalah :
a. Excel
b. SPSS
c. Hadroop
d. Integral
190. Penerapan
analisis big data dalam konteks penerimaan pajak memiliki banyak potensi,
diantaranya kecuali:
a. Memperkaya profil wajib pajak
b. Dapat
melihat relasi antar-wajib pajak
c. Mengurangi
risiko biaya
d. Dapat
mengidentifikasi risiko ketidakpatuhan setiap wajib pajak
191. Teknik
untuk membantu melihat pelanggan mana yang akan meninggalkan layanan sehingga perusahaan dapat mengembangkan strategi yang tepat untuk mempertahankan pelanggan, disebut :
a. Segmentasi pelanggan
b. Upselling
c. Churn-prediction
d. Credit
scoring
192. Contoh
dari direct tax adalah
a. Data wajib pajak penghasilan badan
b. Data
PPN
c. Data
CSR
d. Data
perbankan
193. Rendahnya
tingkat tax compliance jika dilihat dari big data adalah:
a. Kualitas
data yang tidak mendukung
b. Big
data belum di manfaatkan dengan optimal oleh otoritas pajak
c. Perlunya
memberikan insentif
d. Rendahnya ketersediaan dana pajak
194. Market
basket analysis termasuk kelompok peran sains data pada industri keuangan : a. Bisnis
real estate
b. Bisnis
melalui CRM
c. Lainnya
d. Manajemen
risiko
195. Tahapan
dalam money laundry dimana sudah mulai digunakan mata uang digital, adalah
tahap :
a. Layering
b. Integration
c. Placement
d. Credit
scoring
196. Kegunaan
big data bagi pemerintah sangat penting, diantaranya :
a. Menjadi
biaya tinggi bagi pemerintah
b. Meningkatkan pendapatan negara
c. Memberikan
peluang untuk melakukan rekayasa transaksi
d. Merupakan
sarana untuk menyembunyikan transaksi
197. Mendorong
konsumen untuk membeli model yang lebih mahal dalam brand atau kategori produk
yang sama, atas untuk menambah model asli dengan fitur tambahan, disebut :
a. Cross-selling
b. Upselling
c. Pre-selling
d. Down-selling
198. Berikut
pemanfaatan data bagi DJP, kecuali:
a. Data
eksternal
b. Data
warehouse
c. Internal
data
d. Data pribadi
199. Tahapan
algoritma C4.5 untuk membangun pohon keputusan setelah tahap “bagi kasus dalam
cabang” adalah
a. Membuat
aturan asosiasi
b. Pilih
atribut sebagai akar
c. Ulangi proses untuk masing-masing cabang sampai semua
kasus pada cabang memiliki kelas yang
sama
d. Buat
cabang untuk masing-masing nilai
200. Berikut
ini yang termasuk klasifikasi variabel segmentasi yang tidak dapat diobservasi
terkait produk-spesifik adalah :
a. Preferensi
b. Loyalitas
c. Psikografik
d. Demografi
201. Apakah
yang dimaksud dengan veracity dalam big data:
a. Ukuran
data
b. Sebuah
aplikasi dapat membuat/mengumpulkan banyak jenis data
c. Data
dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga d. Akurasi data
202. Artificial
intelligence pada tahun 1980 an – 2010 an berfokus pada:
a. Jaringan
neural
b. Pembelajaran mesin
c. Pembelajaran
mendalam
d. Memprediksi
sinyal yang dibuat
203. Apakah
yang dimaksud dengan variety dan complexity dalam big data:
a. Ukuran
data
b. Sebuah aplikasi dapat membuat/mengumpulkan banyak
jenis data
c. Akurasi
data
d. Data
dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
204. Berikut
ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:
a. Penanganan
bagasi
b. Booking
perjalanan
c. Smart track system
d. Komparasi
tiket termurah
205. Bidang
ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya
terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan
pengenalan pola adalah definisi dari:
a. Sains
data
b. Big
data
c. Kecerdasan
buatan
d. Artificial intelligence
206. Apakah
yang dimaksud dengan big data:
a. Disiplin
ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik),
baik yang terstruktur maupun tidak terstruktur
b. Kecerdasan
yang ditampilkan oleh mesin, di mana, pembelajaran dan kemampuan berbasis
tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses
c. Bidang
ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya
terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan
pengenalan pola
d. Data yang skala, keragaman, dan kompleksitasnya
memerlukan arsitektur, Teknik,
algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang tersembunyi
207. Pendeteksi/pengklasifikasian
cyberbullying adalah contoh implementasi artificial intellingence di bidang:
a. Psikologi
b. SDM
c. Ritail
d. Bahasa
dan NLP
208. Apakah
yang dimaksud dengan sains data:
a. Disiplin ilmu yang khusus mempelajari data, khususnya
data kuantitatif (data numerik), baik
yang terstruktur maupun tidak terstruktur
b. Kecerdasan
yang ditampilkan oleh mesin, di mana, pembelajaran dan kemampuan berbasis
tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses
c. Data
yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik,
algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan
yang tersembunyi
d. Bidang
ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya
terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan
pengenalan pola
209. Tujuan
utama penggunaan artificial intellingence adalah :
a. Monitoring
aktivitas dan kondisi tubuh kita
b. Untuk meningkatkan kemampuan manusia dengan membuat
perangkat lebih mampu dan meningkat UX
c. Menciptakan
komputasi yang lebih personal, meningkatkan produktivitas, menemukan kembali
proses bisnis, dan membangun platform cloud yang cerdas
d. Streaming
data
210. Data
yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik,
algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan
yang tersembunyi adalah definisi dari:
a. Sains
data
b. Big data
c. Kecerdasan
buatan
d. Artificial
intelligence
211. Bidang
ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya
terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan
pengenalan pola adalah definisi dari:
a. Sains
data
b. Artificial intelligence
c. Kecerdasan
buatan
d. Big
data
212. Apakah
yang dimaksud dengan volume dalam big data:
a. Sebuah
aplikasi dapat membuat/mengumpulkan banyak jenis data
b. Ukuran data
c. Akurasi
data
d. Data
dihasillkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
213. Artificial
intelligence pada tahun 2011 – saat ini berfokus pada:
a. Memprediksi
sinyal yang dibuat
b. Pembelajaran mendalam
c. Pembelajaran
mesin
d. Jaringan
neural
214. Berikut
ini adalah definisi artificial intelligence:
a. Data
yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik,
algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan
yang tersembunyi
b. Bidang ilmu komputer yang dikhususkan untuk
memecahkan masalah kognitif yang umumnya
terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola
c. Kecerdasan
yang ditampilkan oleh mesin, di mana, pembelajaran dan kemampuan berbasis
tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses
d. Disiplin
ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik),
baik yang terstruktur maupun tidak terstruktur
215. Tool
yang digunakan dalam sains data adalah:
a. PyTorch
b. Shogun
c. R
d. Kaffe
216. Berikut
ini adalah pernyataan yang benar mengenai last mile delivery:
a. Jawaban
tidak ada yang benar
b. Konsep
arsitektur yang mengintegrasikan teknologi dan mengumpulkan data untuk
mengoptimalkan efisiensi operasi
c. Cara yang digunakan distributor atau retailer untuk
mengirim barang ke konsumen secara
langsung tanpa menggunakan pihak ketiga
d. Senjata
tersembunyi yang memungkinkan seorang arsitek untuk mengubah parameter tertentu
untuk membuat berbagai jenis desain
217. Apakah
yang dimaksud dengan velocity dalam big data:
a. Data dihasilkan secara cepat, maka dibutuhkan
pemrosesan yang cepat juga
b. Sebuah
aplikasi dapat membuat/mengumpulkan banyak jenis data
c. Ukuran
data
d. Akurasi
data
218. Disiplin
ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik),
baik yang terstruktur maupun tidak terstruktur adalah definisi dari:
a. Kecerdasan
buatan
b. Sains data
c. Artificial
intelligence
d. Big
data
219. Artificial
intelligence pada tahun 1950 an – 1970 an berfokus pada:
a. Pembelajaran
mesin
b. Jaringan neural
c. Pembelajaran
mendalam
d. Memprediksi
sinyal yang dibuat
220. Apakah
yang dimaksud dengan kecerdasan buatan:
a. Data
yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik,
algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan
yang tersembunyi
b. Kecerdasan yang ditampilkan oleh mesin, di mana,
pembelajaran dan kemampuan berbasis
tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses
c. Disiplin
ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik),
baik yang terstruktur maupun tidak terstruktur
d. Bidang
ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya
terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan
pengenalan pola
221. Data
cleaning, data integration, data reduction, data transformation adalah proses …
pada data mining :
a. Data
scientist
b. Data
science application developer
c. Data pre-processing
d. Data
analyst/business analyst
222. Definisi
supervised learning adalah, kecuali :
a. Pembelajaran
dengan guru, data set memiliki target/label/class
b. Sebagian
besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning
c. Variable (atribut) yang menjadi target/label/class
tidak ditentukan (tidak ada)
d. Algoritma
melakukan proses belajar berdasarkan nilai dari variable target yang
terasosiasi dengan nilai dari variable prediktor
223. Evolusi
science (evolution of sciences) sebelum tahun 1600 adalah :
a. Data
science
b. Theoretical
science
c. Computational
science
d. Empirical science
224. Metode
data mining yang menggunakan data dengan label dan tidak berlabel sekaligus
dalam proses pembelajarannya adalah :
a. Semi-Supervised learning
b. Supervised
learning
c. Type
of data
d. Unsupervised
learning
225. Evolusi
science (evolution of sciences) tahun 1600-1950 adalah :
a. Empirical
science
b. Theoretical science
c. Data
science
d. Computational
science
226. Evolusi
science (evolution of science) tahun 1950-1990 adalah :
a. Computational science
b. Data
science
c. Theoretical
science
d. Empirical
science
227. Pembagian
dataset pada pengujian model data mining adalah kecuali:
a. Data
training
b. Data estimation
c. Data
validation
d. Data
testing
228. FP-growth,
A priori, coefficient of correlation, chi square adalah algoritma pada … didata
mining :
a. Classification
b. Clustering
c. Association
d. Estimasi
229. Evolusi
science (evolution of science) tahun 1990 – now adalah :
a. Data science
b. Empirical
science
c. Computational
science
d. Theoretical
science
230. Definisi
unsupervised learning adalah, kecuali :
a. Sebagian besar algoritma data mining (estimation,
prediction/forecasting, classification)
adalah supervised learning
b. Algoritma
clustering adalah algoritma unsupervised learning
c. Variable
(atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
d. Algoritma
data mining mencari pola dari semua variable (atribut)
231. Algoritma
association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang
:
a. Customer
segmentation
b. Bioinformatics
c. Muncul bersamaan
d. Monitoring
system
232. Pola,
rumus, aturan atau model yang muncul dari data adalah definisi dari:
a. Data
b. Informasi
c. Sistem
d. Pengetahuan
233. Fakta
yang terekam dan tidak membawa arti adalah definisi dari:
a. Pengetahuan
b. Informasi
c. Sistem
d. Data
234. Peran
utama data mining adalah sebagai berikut, kecuali :
a. Prediksi
b. Klastering
c. Penetuan
d. Estimasi
235. Untuk
pengujian model pada pengujian model data mining adalah :
a. Data testing
b. Data
training
c. Data
estimation
d. Data
validation
236. RapidMiner
adalah :
a. Manages
daily operation of facilities and resources and responds to customer requests
b. Designs
and implements or monitors and maintains large-scale cloud databases
c. Software data mining dan data analytics
d. Manages
daily operations of cloud storages, including related to data life cycle, and
responds to requests from storage users
237. Linear
regression, neural network, support vector machine adalah algoritma pada …
didata mining:
a. Classification
b. Clustering
c. Estimasi
d. Association
238. Beberapa
definisi data mining adalah, kecuali :
a. Kegiatan yang
meliputi pengumpulan,
pemakaian data historis untuk
menemukan keteraturan, pola dan hubungan dalam set data berukuran besar
b. Extraction
of interesting (non-trivial, implicit, previously unknown and potentially
useful) patterns or knowledge from huge amount of data
c. Melakukan
esktraksi untuk mendapatkan informasi penting yang sifatnya implisit dan
sebelumnya tidak diketahui, dari suatu data
d. Searching for different sources of data and capturing
structured and unstructured data
239. Untuk
pembentukan model pada pengujian model data mining adalah :
a. Data
testing
b. Data
validation
c. Data
estimation
d. Data training
240. Contoh
penerapan data mining adalah sebagai berikut, kecuali :
a. Penjadwalan pemeliharaan
b. Analisis
pola belanja pelanggan
c. Penentuan
pasokan listrik PLN untuk wilayah Jakarta
d. Deteksi
serangan (instrusion) pada suatu jaringan
241. Amazon/Alexa,
Microsoft/Cortana merupakan contoh pemanfaatan AI di Bahasa dengan teknologi
a. Drone
control
b. Google
translate
c. Chat
bot Al
d. Smart speaker
242. Apakah
yang dimaksud dengan Variety dan Complexity dalam Big Data:
a. Sebuah
aplikasi dapat membuat/mengumpulkan banyak jenis data
b. Ukuran
data
c. Akurasi data
d. Data
dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
243. Beda
Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki "has
problem solving skills, knowledge of basic statistic". Hal tersebut ada
pada fitur : a. Skill
b. Background
c. Type
of data
d. Scope
244. Berikut
contoh penggunaan database pada lingkungan big data, kecuali : a. Exel
b. Postgresql
c. Hdfs
d. Druid
245. Berikut
ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:
a. Booking
perjalanan
b. Penanganan
bagasi
c. Smart track system
d. Komparasi
tiket termurah
246. Bidang
ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya
terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan
pengenalan pola merupakan definisis dari
a. Metode
numerik
b. Sains
data
c. Artificial intelligence
d. Kecerdasan
buatan
247. Bidang
studi multidisiplin dengan tujuan untuk mengatasi tantangan dalam data besar
adalah
a. Metode
numerik
b. Kecerdasan
buatan
c. Sains data
d. Artificial
intelligence
248. Big
data dapat membantu melakukan predictive maintenance & quality pada
industry a. Banking
b. Education
c. Agriculture
d. Automotive
249. Contoh
Pemanfaatan AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010
dengan menggunakan teknologi Internet adalah
a. Internet
informasi travel
b. Blog, SNS two way communication
c. ICT
smart tourism
d. Computer
reservasi berbasis computer
250. Contoh
Platform Online for FIT (Fully Independent Traveler) pada akomodasi adalah a. Gojek
b. Google
c. Airbnb
d. Maps
251. Definisi
Supervised Learning adalah, kecuali :
a. Algoritma
melakukan proses belajar berdasarkan nilai dari variable target yang
terasosiasi dengan nilai dari variable predictor
b. Variable (atribut) yang menjadi target/label/class
tidak ditentukan (tidak ada)
c. Sebagian
besar algoritma data mining (estimation, prediction/forecasting, classification)
adalah supervised learning
d. Pembelajaran
dengan guru, data set memiliki target/label/class
252. Disiplin
ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik),
baik yang terstruktur maupun tidak terstruktur adalah definisi dari:
a. Artificial
intelligence
b. Big
data
c. Kecerdasan
buatan
d. Sains data
253. Jenis
Machine Learning berdasarkan campur tangan manusia adalah
a. Reinforcement learning
b. Batch
learning
c. Model
based learning
d. Instance
based learning
254. Pemanfaatan
AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010 dengan
menggunakan teknologi
a. Computer
b. Internet
c. ICT
d. Blog, SNS
255. Pendeteksi/Pengklasifikasian
Cyberbullying adalah contoh implementasi Artificial Intelligence di bidang:
a. Bahasa dan NLP
b. SDM
c. Ritail
d. Psikologi
256. Penerapan
utama data dari data science pada e-commerce adalah melakukan hal-hal berikut
kecuali :
a. Identifying
consumers
b. Prediction potential problem
c. Analyzing
reviews
d. Recommending
product
257. Sains
Data adalah multi disiplin dari:
a. Datawarehouse,
datamining
b. Statistical model, statistical computing
c. Application
web, application desktop
d. Hardware,
software
258. Sebuah
sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan
platform online yang berbasis teknologi big data menggunakan keahlian
Artificial
Intelligence dan Natural Learning Process (NLP) adalah
a. Drone emprit
b. Data
science
c. Social
network analysis
d. Corpus
259. Teknik
pada Machine Learning adalah, kecuali :
a. Unsupervised
learning
b. Improvement learning
c. Reinforcement
learning
d. Supervised
learning
260. Tujuan
Pengunaan robot dan IOT untuk suatu even sebagai salah satu Revolusi
Industri 4.0 dan Pariwisata adalah
a. Mengurangi
user
b. Efesiensi biaya operasi
c. Berbagi
pengalaman baru
d. Personalisasi
pengalaman wisatawan
Comments
Post a Comment