SAINS DATA DAN ANALISIS BIG DATA | TEAM TEACHING

 

M1

1.      Persentase proses terbesar sebanyak 60% pada Data Scientist adalah pada proses :

a.     Building and training test

b.     Cleaning and Organizing Data

c.     Collecting data sets

d.     Refining Algorithm

 

2.      Penerapan utama data dari data science pada e-commerce adalah melakukan hal-hal berikut kecuali :

a.     Prediction potential problem

b.     Recommending Product

c.     Identifying Consumers

d.     Analyzing Reviews

 

3.      Peran/deskripsi tugas dari Scientific database operator (D3 – S1) adalah :

a.     Manages daily operation of facilities and resources and responds to customer requests.

b.     Manages daily operation of cloud storage, including related to data life cycle, and responds to requests from storage users

c.     Designs and implements or monitors and maintains large-scale cloud databases

d.     Manages daily operation of scientific databases, including related to data life cycle, and responds to requests from database users.

 

4.      Siklus Hidup Sains Data pada Data Preparation adalah melakukan :

a.     Searching for different sources of data and capturing structured and unstructured data

b.     Converting data into a common format

c.     Gathering information and deriving outcomes based on business requirements

d.     Using variables and equations to establish relationship

 

5.      Profil Profesional Sains Data tergolong keluarga pekerjaan (okupasi) terkait data. Pekerjaan baru yang diusulkan ditemaptkan dalam empat kelompok klasifikasi teratas adalah manager, professional madya dan kerja pendukung klerikal. Yang termasuk professional adalah :

a.     kurator dan pengurus (stewards) data

b.     CEO

c.     Operator dan Teknisi

d.     Pengembang aplikasi dan insinyur/perekaya infrastuktur

 

6.      Komponen-kompone dari Sains data pada DOMAIN KNOWLEDGE adalah, kecuali :

a.     Highlight important criteria

b.     Easier Explanation of technical concept

c.     Designing Methods

d.     Client Requirement

7.      Teknik pada Machine Learning adalah, kecuali :

a.     Improvenetal Learning

b.     Reinforcement Learning

c.     Supervised Learning

d.     UnSupervised Learning

 

8.      Penerapan utama data dari data science pada banking adalah melakukan hal-hal berikut

:

a.     Drug Discovery, Bioinfomatics, Maintenance Schedulling

b.     Customer Segmentation, identifying

c.     Monitoring System, Maintenance System

d.     Self Driving Car, Car Monitoring System, Enhanced driving Experience, Enhanced the safety of Passenger

 

9.      Beda Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki “has problem solving skills, knowledge of basic statistic”. Hal tersebut ada pada fitur : a. Skill

b.     Type of Data

c.     Background

d.     Scope

 

10.   Siklus Hidup Sains Data pada Data Discovery adalah melakukan :

a.     Searching for different sources of data and capturing structured and unstructured data

b.     Gathering information and deriving outcomes based on business requirements

c.     Converting data into a common format

d.     Using variables and equations to establish relationship

 

11.   Peran/deskripsi tugas dari Business Analyst (S1) adalah :

a.     Design and maintains the architecture of data science applications and facilities

b.     Analyses a large variety of data information system for improving business performance.

c.     Analyses a large variety of data to extract information about system, service or organization performance and presents them in usable/actionable form.

d.     Design/develops/codes large data analytics applications

 

12.   Dalam membangun Tim Sains Data, personil yang dibutuhkan pada tahap data analysis adalah, kecuali :

a.     Data Analyst/Business Analyst

b.     Researcher

c.     Data Scientist

d.     Data Science Application Developer

13.   Task seorang Data Scientist adalah :

a.     Interpret and Manage data and solve complex problems using expertise in a variety of data niches

b.     Develop and initiate innovative statistical technique, issues and protocols

c.     Analyst data with specific statistical software and developing theory of statistics

d.     To provide new insights into business and create solutions that enable enhanced business performances

 

14.   Alur proses Sains Data adalah :

a.     Get Data - Explore – Model Data – Stimulate Results – Visualize Result – Use

Result in business

b.     Get Data – model Data – Explore - Visualize Result - Stimulate Results - Use Result in business

c.     Get Data - Explore – Model Data – Visualize Result – Stimulate Results - Use

Result in business

d.     Get Data - Explore – Visualize Result – Model Data – Stimulate Results - Use Result in business

 

15.   Penerapan utama data dari data science pada banking adalah melakukan hal-hal berikut kecuali :

a.     DROP

b.     Fraud Detection

c.     REVOKE

d.     Virtual Assitants

 

16.   Sains data adalah multi disiplin dari:

a.     Application web, Application desktop

b.     Datawarehouse, Datamining

c.     Statistical Model, Statistical Computing

d.     Hardware, Software

 

17.   Responsibilities seorang Data Scientist adalah :

a.     Analyst data with specific statistical software and developing theory of statistics

b.     Interpret and Manage data and solve complex problems using expertise in a variety of data niches

c.     Develop and initiate innovative statistical technique, issues and protocols

d.     To provide new insights into business and create solutions that enable enhanced business performances

 

18.   Siklus Hidup Sains Data pada Mathematical Models adalah melakukan :

a.     Converting data into a common format

b.     Gathering information and deriving outcomes based on business requirements

c.     Searching for different sources of data and capturing structured and unstructured data

d.     Using variables and equations to establish relationship

 

19.   Definisi Data Science dari NIST (2018) :

a.     Data science combines the scientific method, math and statistics

b.     Data science is an inter-disciplinary field that uses scientific methods, processes,algorithms … in managing a digital data collection

c.     Data science is the field of study that combines domain expertise, programming skills, and knowledge of mathematics and statistics to extract meaningful insights from data

d.     Data science is the extraction of useful knowledge directly from data through a process of discovery, or of hypothesis formulation and hypothesis testing

 

20.   Siklus Hidup Sains Data pada Getting things in action adalah melakukan :

a.     Converting data into a common format

b.     Gathering information and deriving outcomes based on business requirements

c.     Using variables and equations to establish relationship

d.     Searching for different sources of data and capturing structured and unstructured data

 

M2

21.  Apa kepanjangan CEP :

a.     Campaign Event Processing

b.     Collaboration Event Processing

c.     Complex Event Processing

d.     Communication Event Processing

 

22.  Berikut kepanjangan dari ETL :

a.     Example, Transformation, Load

b.     Extraction, Transformation, Load

c.     Extraction, Transaction, Load

d.     Extraction, Transformation, Listen

 

23.  Berikut tahapan layer pada proses ETL :

a.     Row Layer, Gold Layer, Business Layer

b.     Row Layer, Business Layer, Gold Layer

c.     Record Layer, Row Layer, Gold Layer

d.     Business Layer, Row Layer, Gold Layer

 

24.  Berikut urutan yang tepat dalam proses dashboard development :

a.     UAT and Deployment, Detailed Requirement Gathering, Design, Development

b.     Design, Detailed Requirement Gathering, Development, UAT and Deployment

c.     Development, Detailed Requirement Gathering, Design, UAT and Deployment

d.     Detailed Requirement Gathering, Design, Development, UAT and Deployment

25.  Berikut yang merupakan query access :

a.     Postgresql dan Hive

b.     HDFS dan Hive

c.     Hbase dan Postgresql

d.     Hive dan Phoenix

 

26.  Berikut tool yang tepat digunakan sebagai api gateway :

a.     Hive

b.     Kafka

c.     Spark

d.     Kong

 

27.  Terdapat 3 komponen utama dalam memproses CEP :

a.     Rule

b.     Data Layer

c.     Event

d.     Dataset

 

28.  Pada proses realtime ingestion, tools yang digunakan sebagai message broker dalam hal ini adalah : a. Krakend

b.     Airflow

c.     Zeppelin

d.     Kafka

 

29.  Tools yang berfungsi sebagai tempat visualisasi dashboard dari hasil ETL : a. Hive

b.     Superset

c.     Kong

d.     Zeppelin

 

30.  Dalam proses Detail Requirement Gathering terdapat prose :

a.     Data Source Identification

b.     UAT dengan customer

c.     Deployment dan operation monitoring

d.     ETL Development

 

31.  Deployment   dan   operation   monitoring   terdapat   pada   tahap … pada proses development:

a.     Detailed Requirement Gathering

b.     Development

c.     Deployment

d.     Design

32.  Campaign dapat dikirim melalui berbagai channel seperti berikut, kecuali :

a.     Notifikasi Apps

b.     Ditelphone

c.     SMS

d.     Email

 

33.  Apa saja poin penting dalam big data, kecuali :

a.     Volume

b.     Variety

c.     Velocity

d.     Vacility

 

34.  Yang bukan termasuk proses dalam tahap development adalah :

a.     Dashboard Development

b.     System Integration Test (SIT)

c.     Data Source Identification

d.     ETL Development

 

35.  Dalam proses Cep, Debezium berfungsi sebagai :

a.     Tempat penyimpanan setiap event yang masuk

b.     Melakukan evaluasi setiap event terhadap rule yang tersedia

c.     Mengirim campaign yang telah dievaluasi kepada customer

d.     Change Data Capture, atau membaca setiap perubahan yang terjadi pada database

 

36.  Berikut contoh penggunaan database pada lingkungan big data, kecuali :

a.     Postgresql

b.     Exel

c.     Hdfs

d.     Druid

 

37.  Dalam hal evaluasi CEP, tools yang dapat bertindak sebagai API gateway adalah : a. Hbase

b.     Spark

c.     Debezium

d.     Kong

 

38.  Tools yang berfungsi sebagai process scheduler :

a.     Hive

b.     Kafka

c.     Kong

d.     Airflow

 

39.  CEP merupakan produk campaign marketing yang mengirim campaign secara : a. Realtime

b.     Scheduling

c.     Batch

d.     Random

 

40.  Prinsip kerja dari CEP dalam mengirim sebuah campaign adalah secara :

a.     Batch dan general

b.     Batch dan personalize

c.     Realtime dan personalize

d.     Random dan general

 

M3

41.   Untuk pengujian model pada Pengujian Model Data Mining adalah :

a.     Data validation

b.     Data training

c.     Data estimation

d.     Data testing

 

42.   Beberapa definisi data mining adalah, kecuali :

a.     Extraction of interesting (non-trivial, implicit, previously unknown and potentially useful) patterns or knowledge from huge amount of data

b.     Searching for different sources of data and capturing structured and unstructured data

c.     Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar

d.     Melakukan esktraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data

 

43.   Evolusi Science (Evolution of Sciences) sebelum tahun 1600 adalah :

a.     Theoretical science

b.     Computational science

c.     Empirical science

d.     Data science

 

44.   Evolusi Science (Evolution of Science) tahun 1950-1990 adalah :

a.     Theoretical science

b.     Computational science

c.     Empirical science

d.     Data science

 

45.   Rapidminer adalah :

a.     Designs and implements or monitors and maintains large-scale cloud databases

b.     Software data mining dan data analytics

c.     Manages daily operation of facilities and resources and responds to customer requests

d.     Manages daily operation of cloud storage, including related to data life cycle, and responds to requests from storage users

 

46.   Evolusi Science (Evolution of Sciences) tahun 1600-1950 adalah :

a.     Theoretical science

b.     Empirical science

c.     Computational science

d.     Data science

 

47.   Peran utama data mining adalah sebagai berikut, kecuali :

a.     Penentuan

b.     Prediksi

c.     Estimasi

d.     Klastering

 

48.   Linear Regression, Neural Network, Support Vector Machine adalah algoritma pada … didata mining:

a.     Classification

b.     Clustering

c.     Estimasi

d.     Association

 

49.   Pembagian Dataset pada Pengujian Model Data Mining adalah kecuali:

a.     Data validation

b.     Data estimation

c.     Data training

d.     Data testing

 

50.   Untuk pembentukan model pada Pengujian Model Data Mining adalah :

a.     Data estimation

b.     Data training

c.     Data validation

d.     Data testing

 

51.   Evolusi Science (Evolution of Sciences) tahun 1990 - now adalah :

a.     Theoretical science

b.     Computational science

c.     Empirical science

d.     Data science

 

52.   Fakta yang terekam dan tidak membawa arti adalah definisi dari:

a.     Informasi

b.     Sistem

c.     Pengetahuan

d.     Data

 

53.   Metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus dalam proses pembelajarannya adalah : a. Unsupervised Learning

b.     Supervised Learning

c.     Type of Data

d.     Semi-Supervised Learning

 

54.   Data cleaning, Data Integration, Data Reduction, Data Transformation adalah proses

… pada Data mining :

a.     Data Pre-processing

b.     Data Scientist

c.     Data Analyst/Business Analyst

d.     Data Science Application Developer

 

55.   Pola, rumus, aturan atau model yang muncul dari data adalah definisi dari: a. Data

b.     Informasi

c.     Pengetahuan

d.     Sistem

 

56.   Definisi Unsupervised Learning adalah, kecuali :

a.     Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)

b.     Algoritma data mining mencari pola dari semua variable (atribut)

c.     Algoritma clustering adalah algoritma unsupervised learning

d.     Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning

 

57.   FP-growth, A Priori, Coefficient of Correlation, Chi Square adalah algoritma pada … didata mining :

a.     Association

b.     Clustering

c.     Classification

d.     Estimasi

 

58.   Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang :

a.     Bioinformatics

b.     Customer Segmentation

c.     Muncul Bersamaan

d.     Monitoring System

59.   Contoh Penerapan Data Mining adalah sebagai berikut, kecuali :

a.     Penetuan pasokan listrik PLN untuk wilayah Jakarta

b.     Penjadwalan pemeliharaan

c.     Analisis pola belanja pelanggan

d.     Deteksi serangan (intrusion) pada suatu jaringan

 

60.   Definisi Supervised Learning adalah, kecuali :

a.     Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)

b.     Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning

c.     Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang terasosiasi dengan nilai dari variable predictor

d.     Pembelajaran dengan guru, data set memiliki target/label/class

 

    M4

61.  Graf tidak berarah dimana antara dua simpul terhubung oleh hanya satu jalur (tidak terdapat siklus) adalah: a. Regular

b.     Hutan (Forest)

c.     Pohon (Tree)

d.     Asiklik (acyclic)  

62.  Ukuran terkait kekuatan dalam jaringan yang menunjukkan simpul mana yang berperan dalam sebagai perantara, yaitu seberapa sering sebuah simpul dilalui oleh lintasan terpendek adalah:

a.     Sentralitas Eigenvector

b.     Kedekatan sentralitas

c.     Derajat sentralitas

d.     Sentralitas keantaraan

 

63.  Pseudo Graf adalah:

a.     Graf yang tidak memiliki loop sendiri tetapi terdapat ruas yang parallel

b.     Graf yang memiliki loop sendiri tetapi tidak ada ruas yang paralel

c.     Graf memiliki derajat yang sama

d.     Graf terhubung dimana semua simpul berderajat genap

 

64.  Graf yang hanya memiliki 1 simpul adalah:

a.     Graf tidak terhubung

b.     Graf semu (trivial)

c.     Graf hampa

d.     Graf terhubung

 

65.  Graf yang tak berarah, tak terhubung atau dengan kata lain kumpulan pohon yang tidak saling terhubung adalah:

a.     Hutan (Forest)

b.     Regular

c.     Asiklik (acyclic)

d.     Pohon (Tree)

 

66.  Algoritma untuk pohon rentang minimum adalah:

a.     Semua jawaban salah

b.     Algoritma djikstra

c.     Algoritma Kruskal

d.     Algoritma perjalanan salesman

 

67.  Graf yang memiliki simpul tetapi tidak memilik ruas disebut:

a.     Graf terhubung

b.     Graf tidak terhubung

c.     Graf hampa

d.     Graf semu (trivial)

 

68.  Istilah lain untuk simpul pada graf adalah:

a.     Edge

b.     Lintasan

c.     Ruas

d.     Vertex

 

69.  Panjang Lintasan (Path) adalah:

a.     Himpunan Simpul

b.     Jumlah ruas yang terhubung pada simpul tersebut

c.     Penghubung antar simpul

d.     Jumlah lintasan dari satu simpul ke simpul lain

 

70.  Graf dimana terdapat siklus dari sebuah simpul yang mengunjungi setiap simpul dalam graf tepat satu kali disebut dengan: a. Graf Hamilton

b.     Graf Euler

c.     Graf bipartite

d.     Graf plannar

 

71.  Apakah yang dimaksud dengan Derajat pada graf:

a.     Himpunan Simpul

b.     Jumlah lintasan dari satu simpul ke simpul lain

c.     Jumlah ruas yang terhubung pada simpul tersebut

d.     Penghubung antar simpul

 

72.  Ukuran terkait kekuatan dalam jaringan yang menunjukkan seberapa penting orang/pihak lain yang mempunyai jaringan dengan actor (simpul) adalah:

a.     Kedekatan sentralitas

b.     Sentralitas keantaraan

c.     Sentralitas Eigenvector

d.     Derajat sentralitas  

73.  Jenis Graf apakah yang antara setiap pasang simpul terdapat minimum satu jalur: a. Graf semu (trivial)

b.     Graf hampa

c.     Graf tidak terhubung

d.     Graf terhubung

 

74.  Apakah yang dimaksud dengan Ruas Paralel dalam graf:

a.     Jika terdapat lebih dari satu ruas antara dua simpul yang bersebelahan

b.     Sebuah ruas dari dan ke satu simpul

c.     Sebuah Graf dengan jumlah simpul dan ruas yang berhingga

d.     Graf memiliki derajat yang sama

 

75.  Graf yang dapat dibentuk pada sebuah bidang sedemikian sehingga tidak terdapat dua ruas yang saling bersilangan adalah: a. Graf bipartite

b.     Graf Hamilton

c.     Graf Euler

d.     Graf plannar

 

76.  Ruas adalah :

a.     Himpunan Simpul

b.     Jumlah lintasan dari satu simpul ke simpul lain

c.     Jumlah yang terhubung pada simpul tersebut

d.     Penghubung antar simpul

 

77.  Multi Graf adalah:

a.     Graf memiliki derajat yang sama

b.     Graf yang memiliki loop sendiri tetapi tidak ada ruas yang paralel

c.     Graf yang tidak memiliki loop sendiri tetapi terdapat ruas yang paralel

d.     Graf terhubung dimana semua simpul berderajat genap

 

78.  Himpunan ruas yang dapat membagi graf G menjadi dua sub-graf S dan T disebut dengan:

a.     cyclic (siklik)

b.     Himpunan pemotong (cut set)

c.     Lintasa

d.     Derajat

79.  Siapakah ilmuwan penemu Teori Graf :

a.     Blaise Pascal

b.     Leonhard Euler

c.     Bill Gates

d.     Dennis Ritchie

 

80.  Jenis Graf apakah dimana terdapat dua simpul yang tidak memiliki jalur yang menghubungkan ke dua simpul tersebut: a. Graf semu (trivial)

b.     Graf terhubung

c.     Graf tidak terhubung

d.     Graf hampa

 

     M5

81.   Tahapan Feature Extraction pada NLP adalah:

a.       Vector Space Model

b.      Text Similarity

c.       Tokenization

d.      Sequential Labeling

 

82.   Disebut apakah jenis ambiguitas dari satu kata:

a.       Ambiguitas Semantik

b.      Ambiguitas Leksikal

c.       Ambiguitas Anaforis

d.      Ambiguitas Sintaksis

 

83.   Pernyataan berikut ini adalah keuntungan dari NLP:

a.       Sistem NLP terkadang tidak memiliki antarmuka pengguna

b.      Akurasi jawaban meningkat dengan jumlah informasi relevan yang diberikan dalam pertanyaan

c.       Tidak dapat beradaptasi dengan domain dan masalah baru karena fungsinya yang terbatas

d.      Bahasa Query Kompleks

 

84.   Masalah yang terdapat pada disiplin Psikolinguis adalah:

a.       Bagaimana frase dan kalimat dapat dibentuk dengan kata-kata?

b.      Bagaimana manusia dapat mengidentifikasi struktur kalimat?

c.       Bagaimana kata dan kalimat mendapatkan maknanya?

d.      Bagaimana pengetahuan dan penalaran dapat dimodelkan?

 

85.   Mobil menabrak tiang saat sedang melaju adalah contoh dari ambiguitas:

a.       Ambiguitas Leksikal

b.      Ambiguitas Sintaksis

c.       Ambiguitas Semantik

d.      Ambiguitas Anaforis

 

86.   Berikut ini tekhnik pemrosesan bahasa alami umum yang merupakan Grammar Correction adalah:

a.       Meringkas informasi penting dari suatu sumber untuk menghasilkan versi yang dipersingkat

b.      Google, Yahoo, Bing

c.       Ketik kata kunci untuk mengajukan pertanyaan

d.      Koreksi ejaan dan tata Bahasa

 

87.   Startup NLP di Indonesia yang menjadikan conversational AI dengan chatbot sebagai produk utama mereka adalah... a. Kata.ai dan Bahasa.ai

b.     Prosa.ai dan Bahasa.ai

c.     Prosa.ai

d.     Prosa.ai dan Kata.ai

 

88.   Berikut ini adalah contoh dari pengkategorian teks kecuali:

a.       Translation

b.      Essay Scoring

c.       Sentiment Analysis

d.      Spam Filtering

 

89.   Berikut ini yang bukan domain Computational Linguistics adalah:

a.       Bagaimana mempelajari Bahasa

b.      Bagaimana memahami Bahasa

c.       Bagaimana menghasilkan Bahasa

d.      Menyelesaikan practical problem yang melibatkan Bahasa manusia

 

90.   Dasar pemrosesan teks dari berbagai NPL task adalah sebagai berikut, kecuali:

a.       Pengektraksian Informasi

b.      Tokenisasi

c.       Mengkategorisasi teks

d.      Mengklasifikasi teks

 

91.   Startup NLP di Indonesia yang menyediakan layanan text berupa Prosa Text API adalah:

a.       Kata.ai

b.      Veronica

c.       Bahasa.ai

d.      Prosa.ai

 

92.   Sistem penulisan apakah dimana simbol individu mewakili suku kata: a. Silabis

b.     Abjad

c.     Grafik

d.     Logografik

 

93.   Masalah yang terdapat pada disiplin Ahli bahasa adalah:

a.       Bagaimana manusia dapat mengidentifikasi struktur kalimat?

b.      Bagaimana kata dan kalimat mendapatkan maknanya?

c.       Bagaimana frase dan kalimat dapat dibentuk dengan kata-kata?

d.      Bagaimana pengetahuan dan penalaran dapat dimodelkan?

 

94.   Pernyataan berikut ini adalah kerugian dari NLP:

a.       Sistem ini dibangun untuk satu tugas dan spesifik saja

b.      Sistem NLP memberikan jawaban atas pertanyaan dalam bahasa alami

c.       Sistem NLP menawarkan jawaban yang tepat untuk pertanyaan, tidak ada informasi yang tidak perlu atau tidak diinginkan

d.      Pengguna dapat mengajukan pertanyaan tentang subjek apa pun dan mendapatkan tanggapan langsung dalam hitungan detik

 

95.   Perbedaan utama antara Bahasa Alami dan Bahasa Komputer dengan parameter Literalness adalah:

a.       Bahasa alami terbuat dari idiom dan metafora, sedangkan Bahasa Komputer merupakan bahasa formal memiliki arti yang persis seperti yang ingin mereka katakana

b.      Bahasa Alami bersifat ambigu, sedangkan bahasa komputer dirancang untuk tidak ambigu

c.       Bahasa Alami menggunakan banyak redundansi, sedangkan Bahasa Komputer adalah Bahasa formal tidak terlalu berlebihan

d.      Tidak ada jawaban yang tepat

 

96.   Pemrosesan Bahasa Alami (NLP)menurut Goldberg adalah:

a.       Bidang perancangan metode dan algoritma yang mengambil sebagai masukan atau menghasilan sebagai keluaran, data bahasa alami tidak terstruktur

b.      Metode untuk menyelesaikan prac- tical problem yang melibatkan Bahasa manusia

c.       Desain dan analisis algoritma komputasi dan representasi untuk memproses bahasa alami manusia

d.      Bidang yang mempelajari metode, algoritma, representasi yang memproses input ataupun output yang berupa Bahasa alami, baik berupa teks maupun suara

 

97.   Tahapan NLP apakah dimana tujuan dari tahap ini adalah untuk memecah potongan input bahasa menjadi kumpulan token yang sesuai dengan paragraf, kalimat, dan kata: a. Analisis sintaks

b.     Analisis pragmatis

c.     Pengolahan morfologi

d.     Analisis semantic

98.   Fase NLP yang merupakan fase akhir tahun 1960-an hingga akhir 1970-an dicirikan dengan:

a.       Pekerjaan yang dilakukan dalam fase ini difokuskan terutama pada Mesin

Penerjemah

b.      Mendapat beberapa sumber daya & alat praktis seperti parser, misalnya Alvey Natural Language Tools bersama dengan sistem yang lebih operasional dan komersial, misalnya untuk kueri database.

c.       Pekerjaan yang dilakukan sebagian besar terkait dengan pengetahuan dunia dan perannya dalam konstruksi dan manipulasi representasi makna.

d.      Pendekatan leksikalisasi tata bahasa dan menjadi pengaruh yang meningkat

 

99.   Sub-bidang Ilmu Komputer khususnya Artificial Intelligence (AI) yang berkepentingan untuk memungkinkan komputer memahami dan memproses bahasa manusia, adalah: a. Natural Languange Processing (NLP)

b.     Computer Vision

c.     Expert System

d.     Image Processing

 

100.Tahapan Preposesing pada NLP adalah:

a.       Text Similarity

b.      Tokenization

c.       Vector Space Model

d.      Sequential Labeling

 

     M6

101.    Struktur matematika paling dasar dari suatu grafik adalah :

a.       Banyaknya Set V

b.       Satu set V yang terhubung melalui garis E

c.       Banyaknya garis E

d.       Banyaknya Network

 

102.    Riset tentang network analisis ditemukan pada bidang ilmu :

a.       Data science

b.       Computational science

c.       Theoretical science

d.       Educational psychology

 

103.    Menurut Halgin & DeJordy, 2008 “If your research question is about different patterns of interaction within defined groups” adalah : a. Sociocentric

b.   Egocentric

c.   Anthropologie

d.   Physiocentric

104.    Gephi adalah software social network analysis, kecuali :

a.       Free

b.       Open Source

c.       Berbayar

d.       Interactive visualization and exploration

 

105.    Keuntungan dari social network analysis adalah:

a.       Berfokus pada node

b.       Berfokus pada jaringan

c.       Berfokus pada edge

d.       Berfokus pada interaksi

 

106.    Closeness Centrality adalah :

a.       Ukuran sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur terdekat yang melewatinya.

b.       Ukuran sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat antar node

c.       Ukuran sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah garis penghubung (edge) yang menyambung beberapa node

d.       Ukuran terbentuknya jaringan pada grafik

 

107.    Software Social Network Analysis adalah :

a.       Twitter

b.       RapidMiner

c.       NodeXL dan Gephi

d.       Linux dan Windows

 

108.    Beberapa disiplin ilmu dari Social Network Analysis adalah, kecuali :

a.       Graf network

b.       Transportation network

c.       Social network

d.       Electrical network

 

109.    Tipe dari social network analysis yang “Whole network”

a.     Egocentric

b.     Anthropologie

c.     Physiocentric

d.     Sociocentric

 

110.    Sejarah network analysis pada tahun … New York Times reported on the new science of “psychological geography” : a. 1950

b.       1960

c.       1933

d.       1930

111.    Social Network Analysis adalah :

a.       Studi sociometri

b.       Sebuah      studi    yang    mempelajari    tentang       hubungan        manusia           dengan memanfaatkan teori graf

c.       Metode yang menghubungkan antar node

d.       Peta yang terdiri atas banyak orang dimana di dalamnya terdapat relasi antar individunya

 

112.    Menurut Halgin & DeJordy, 2008 “If your research question is about phenomena of or affecting individual entities across different settings” adalah :

a.     Egocentric

b.     Sociocentric

c.     Anthropologie

d.     Physiocentric

 

113.    Betweenness Centrality adalah :

a.       Ukuran sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah garis penghubung (edge) yang menyambung beberapa node

b.       Ukuran terbentuknya jaringan pada grafik

c.       Ukuran sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat antar node

d.       Ukuran sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur terdekat yang melewatinya.

 

114.    Network analysis dibangun dari :

a.     Sociology

b.     Political

c.     Communication

d.     Economy

 

115.    Edge adalah :

a.     Koneksi antara banyak node

b.     Koneksi antara lebih dari dua buah node

c.     Koneksi antara dua buah jaringan

d.     Koneksi antara dua buah node

 

116.    Tipe dari social network analysis yang “Creates many stand alone network”:

a.     Anthropologie

b.     Physiocentric

c.     Egocentric

d.     Sociocentric

 

117.    Tipe dari social network analysis yang “Creates one network”:

a.     Anthropologie

b.     Sociocentric

c.     Egocentric

d.     Physiocentric

 

118.    NodeXL adalah software social network analysis yang, kecuali

a.       Menggunakan template excel

b.       Open source

c.       Menggunakan template word

d.       Free

 

119.    Degree Centrality adalah :

a.       Ukuran terbentuknya jaringan pada grafik

b.       Ukuran sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur terdekat yang melewatinya

c.       Ukuran sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah garis penghubung (edge) yang menyambung beberapa node

d.       Ukuran sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat antar node

 

120.    Tipe dari social network analysis yang “Personal network”:

a.     Egocentric

b.     Sociocentric

c.     Physiocentric

d.     Anthropologie

 

       M8

121.is a form of qualitative analysis that is concerned with more than just statistics and numerical values.

a.     Analysis

b.     Analysis

c.     Analysis

d.     Text analysis

 

122.focuses on the process of turning raw data into useful statistics, information, and explanations.

a.   Information System

b.   Information

c.   Data

d.   Data analysis

 

123.        Text analysis tools can sort text by :

a.     Read for information

b.     Topic

c.     Extract information

d.     Extract data

 

124.        Sentiment = feelings, kecuali :

a.   Emotions

b.   Soul

c.   Opinions

d.   Attitudes

 

125.recognizing opinion – oriented questions.

a.     Information extraction

b.     Question answering

c.     Bias identifications

d.     Summarization

 

126.A powerful analytics and data visualization perform. Connect all your data and create interactive dashboards that update in real-timey.

a.     R

b.     Tableau

c.     Phyton

d.     rapidMiner

 

127.discarding subjective information.

a.     Question answering

b.     Bias identification

c.     Summarization

d.     Information extraction

 

128.    Application from SA have been useful in other areas, kecuali :

a.     Entertainment

b.     Law/policy making

c.     Politics/political science

d.     Sociology

 

129.    Traditional bullying was limited to …. :

a.     Floral

b.     Schools and youth crowds

c.     Animal

d.     Staff

 

130.    ….. for data analytics teams that want to tackle challenge tasks and handle large amounts of data.

a.     Microsoft Excel

b.     RapidMiner

c.     KNIME

d.     Phyton

 

131.    Process of cleaning, analyzing, interpreting, and visualizing data to discover valuable insights that drive smarter and more effectives business decisions is ….. :

a.     Data

b.     Data analysis

c.     Information

d.     Information system

 

132.bullying with the use of digital technology.

a.     Cyberbullying

b.     Electronicbully

c.     Bullying

d.     Ebully

 

133.filter, organize, and visualize quantitative data. The perfect tool for performing simple data analysis. Explore common functions and formulas for data analysis.

a.     KNIME

b.     Microsoft Excel

c.     Phyton

d.     RapidMiner

 

134.    ….. the preferred programming language for machine learning. Use it to build data analysis solutions for various use cases.

a.     Microsoft Excel

b.     KNIME

c.     RapidMiner

d.     Phyton

 

135.    ….. open-source platform for building advanced machine learning solutions, and visualizing data. :

a.     Microsoft Excel

b.     Phyton

c.     KNIME

d.     RapidMiner

 

136.accounting for multiple viewpoints.

a.     Information extraction

b.     Question answering

c.     Bias identification

d.     Summarization

137.used to analyze data and sort it as positive, negative, or neutral to gain in-depth knowledge about how customers feel towards each aspect.

a.     Data analysis

b.     System analysis

c.     Sentiment analysis

d.     Information analysis

 

138.    Sentiment analysis, also called :

a.     Opinion Mining

b.     Appraisals

c.     Sentiment Mining

d.     Opinion Data

 

139.    Some sentiment analysis jargon :

a.     Collaboration

b.     Analysis

c.     Semantic orientation

d.     Collection

 

140.    Contoh pertanyaan pada sentiment analysis:

a.     Is this product review positive or negative?

b.     How to produce product ?

c.     How many node in graph?

d.     Is far or close ?

 

         M9

141.    Berikut ini merupakan toolkit data mining bersifat open source yang dapat digunakan untuk visualisasi data, machine learning serta memiliki pemrograman visual untuk analisis data kualitatif yang cepat, eksploratif dan interaktif:

a.     Hive

b.     Kafka

c.     Orange

d.     Nifi  

142.    Program database apakah yang digunakan untuk data & statistic pada knowledge explorer Indonesia OneSearch (IOS)?

a.     API

b.     MySQL

c.     Apache SOLR

d.     MongoDB

 

143.    Text information, segmentation and tokenization, text cleaning, vectorization and feature engineering, text lemmatization and stemming, machine learning algorithms, dan result interpretation adalah tahapan dari

a.     NLP pipeline

b.     Phyton

c.     Setiment analysis

d.     Big data analysis

 

144.    Big data dapat membantu melakukan predictive maintenance & quality pada industri a. Automotive

b.     Education

c.     Banking

d.     Agriculuture

 

145.    Sebuah sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan platform online yang berbasis teknologi big data menggunakan keahlian artificial intelligence dan natural learning process (NPL) adalah

a.     Drone emprit

b.     Corpus

c.     Data science

d.     Social network analysis

 

146.    Bidang yang terkait dengan studi, desain dan pengembangan Teknik untuk mengesktrak unit leksikal dari teks dan pemfilteran unit leksikal melalui beberapa skema penilaian dan peringkat, yang digunakan untuk identifikasi istilah disebut

a.     Named Entity Recognition (NER)

b.     Syntax Analysis (S-P-O)

c.     Automatic Term Recognition (ATR)

d.     Part-Of-Speech (POS) Tagging

 

147.    Pada grafik perkembangan data dari tahun 2010 hingga 2020, data terbanyak bersumber dari area berikut kecuali

a.     Social media

b.     Sensors & Devices

c.     Enterprise Data

d.     Exabytes Volume

 

148.    Berikut ini adalah sumber data yang digunakan pada knowledge explorer Indonesia onesearch (IOS), kecuali:

a.     Berita online

b.     iTunes

c.     Blog

d.     Jurnal

 

149.    Ilustrasi hubungan subyek dan obyek yang saling berhubungan melalui predikat dapat dilihat menggunakan

a.     Tree-map

b.     Directed graph

c.     Undirected graph

d.     Co-occurance

 

150.    Berikut ini adalah 3 kriteria big data sederhana

a.     Visibility, value, velocity

b.     Volume, veracity, variety

c.     Visibility, variety, veracity

d.     Volume, velocity, variety

 

151.    NLP digunakan dalam hal-hal berikut kecuali:

a.     Trends Analysis

b.     Sentiment Analysis

c.     Quote extraction

d.     Text-to-speech extraction

 

152.    Sebagian besar data yang semakin bertambah berupa

a.     Balanced data

b.     Unstructured data

c.     Enterprise data

d.     Structured data

 

153.    Berikut adalah manfaat Co-occurance kecuali

a.     Menunjukkan actor yang ada dalam paragraph yang sama

b.     Menampilkan actor penting yang sering muncul bersamaan

c.     Identifikasi jenis korelasi antar pelaku dan istilah

d.     Indikasi adanya korelasi antar pelaku dan istilah

 

154.    SparkNLP dapat melakukan hal berikut kecuali

a.     Stemming

b.     Actor recognition

c.     Sentiment detector

d.     Tokenization

 

155.    Proses NLP yang mengacu pada pengategorian kata-kata dalam teks (korpus) tergantung pada definisi kata dan konteksnya disebut sebagai

a.     Named Entity Recognition (NER)

b.     Syntax Analysis (S-P-O)

c.     Automatic Term Recognition (ATR)

d.     Part-Of-Speech (POS) Tagging

 

156.    NLP pada sistem factminer mendapatkan masukkan dari hal berikut, kecuali

a.     Laporan internal

b.     Dokumen


Berita online

                  d.   Semantic search engine

 

157.    Text mining language yang paling popular adalah

a.     HTML dan KNIME

b.     Phyton dan NLP

c.     Phyton dan R

d.     NLP dan Java

 

158.    Selain tokoh dan organisasi, dalam suatu berita FactMiner dapat mengekstrak data berikut kecuali

a.     Peristiwa

b.     Komentar

c.     Waktu

d.     Lokasi

 

159.    Suatu Teknik yang secara otomatis mengidentifikasi entitas tertentu dalam teks dan mengklasifikasikannya ke dalam kategori yang telah ditentukan sebelumnya disebut

a.     Named Entity Recognition (NER)

b.     Part-Of-Speech (POS) Tagging

c.     Automatic Term Recognition (ATR)

d.     Syntax Analysis (S-P-O)

 

160.    Sebuah tree-map dapat digunakan mengidentfikasi untuk hal berikut kecuali:

a.     Hubungan antar subjek

b.     Aktifitas terkait dengan actor

c.     Obyek atau entitas terkait aktivitas subyek

d.     Aktor perorangan, organisasi, konsep (subyek)

 

     M10

161.  Definisi kampanye menurut rogers dan storey adalah:

a.     Penggunaan berbagai metode komunikasi yang berbeda secara terkoordinasi dalam jangka waktu tertentu yang ditujukan untuk mengarahkan khalayak pada masalah tertentu dan solusinya

b.     Penciptaan Kembali dan pemindahan simbol-simbol penting secara terus menerus melalui komunikasi

c.     Serangkaian Tindakan komunikasi yang direncanakan dengan tujuan menciptakan efek tertentu pada sejumlah besar khalayak yang dilakukan secara berkelanjutan selama periode waktu tertentu

d.     Proses rangkaian komunikasi politik antara kontestan politik dan pemilih

 

162.  Elemen dibawah ini tidak diperhitungkan dalam metrik GRP sosial:

a.     Effective reach

b.     Relevant

Audience relevance

                  d.   Sentiment

 

163.  Model prediktif kampanye politik menghasilkan tiga kategori “skor prediktif”, kecuali a. Skor elektabilitas

b.     Skor respons

c.     Skor dukungan

d.     Skor perilaku

 

164.  Pembersihan data ini dimulai dari awal saat data pertama kali diambil dan melibatkan semua anggota tim yang menyentuh data titik mana pun, merupakan tahapan dalam: a. Data hygienists

b.     Data explorers

c.     Business solution architects

d.     Data scientists

 

165.  Berikut ini bukan termasuk dalam faktor yang mempengaruhi kampanye politik:

a.     Kebijakan politik panitia pemilihan

b.     Perkembangan teknologi

c.     Perkembangan media cetak

d.     Kemunduran partai politik

 

166.  Berikut adalah pernyataan yang tidak benar mengenai heatmap:

a.     Heatmap dapat digunakan menilai kekuatan dan kelemahannya dalam menggunakan big data di semua area fungsional

b.     Heatmap adalah Teknik visuaalisasi data yang menunjukkan besarnya suatu fenomena sebagai warna dalam dua dimensi

c.     Heatmap membantu perusahaan mengidentifikasi dan memprioritaskan peluang untuk investasi

d.     Heatmap memberikan panduan harga pada tingkat transaksi individual

 

167.  GRP (Gross Rating Point) sosial media digital dibagi menjadi tiga.

a.     Data hygienists, data explorers, business solution architects

b.     Skor perilaku, skor dukungan, skor respons

c.     Milik anda (misalnya situs web anda), berbayar (iklan spanduk yang anda beli di situs lain), diperoleh (posting atau komentar orang melalui blog atau tweet)

d.     Effective reach, audience relevance, sentiment

 

168.  Otomatisasi dilakukan untuk mengubah data menjadi laba, apakah yang dilakukan pada otomatisasi ini:

a.     Membuat replikasi dan perubahan analisis lebih mudah sehingga tidak perlu selalu memulai dari awal

b.     Mengungkapkan apa yang mendorong harga untuk setiap segmen pelanggan dan produk

Mengembangkan seperangkat komunikasi yang jelas untuk memberikan alasan harga untuk menonjolkan nilai dan menyesuaikan argumen tersebut dengan pelanggan

d. Mendukung tenaga penjualan dengan target yang bermanfaat

 

169.  Peran data hygienists adalah:

a.     Mengambil data terorganisir dan membuat model analitik canggih

b.     Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis

c.     Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama siklus hidup data

d.     Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan

 

170.  Berikut ini adalah keefektifan dari customer lifecycle managemen, kecuali:

a.     Dapatkan pelanggan baru

b.     Kembangkan pelanggan yang sudah ada

c.     Pertahankan pelanggan yang sudah ada dan menangkan Kembali pelanggan lama

d.     Mengubah model menjadi hasil

 

171.  Skor prediktif yang memprediksi bagaimana warga akan menanggapi penjangkauan kampanye adalah:

a.     Skor perilaku

b.     Skor dukungan

c.     Skor elektabilitas

d.     Skor respons

 

172.  Memprediksi perilaku pelanggan dan memungkinkan segmentasi pelanggan tingkat lanjut dan pengoptimalan harga adalah tahapan dalam:

a.     Data explorers

b.     Data scientists

c.     Business solution architects

d.     Data hygienists

 

173.  Peran data scientist adalah:

a.     Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama siklus hidup data

b.     Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan

c.     Mengambil data terorganisir dan membuat model analitik canggih

d.     Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis


174.  Peran business solution architects adalah:

a.     Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis

b.     Mengambil data terorganisir dan membuat model analitik canggih

c.     Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan

d.     Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama siklus hidup data

 

175.  Peran data explorers adalah:

a.     Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan

b.     Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama siklus hidup data

c.     Mengubah model menjadi hasil

d.     Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis

 

176.  Skor prediktif yang memprediksi preferensi politik warga adalah:

a.     Skor dukungan

b.     Skor respons

c.     Skor elektibilitas

d.     Skor perilaku

 

177.  Menyusun data untuk memastikannya dapat ditanyakan secara berguna dalam kerangka waktu yang sesuai oleh semua pengguna adalah tahapan dalam:

a.     Data hygienists

b.     Data scientists

c.     Data explorers

d.     Business solution architects

 

178.  Skor prediktif yang menggunakan perilaku masa lalu dan informasi demografis untuk menghitung probabilitas eksplisit bahwa warga negara akan terlibat dalam bentuk aktivitas politik tertentu adalah:

a.     Skor perilaku

b.     Skor elektibilitas

c.     Skor dukungan

d.     Skor respons

 

179.  Peran campaign experts adalah:

a.     Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk dianalisis

b.     Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan

c.     Mengubah model menjadi hasil

d.     Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap seperti itu selama siklus hidup data

180.  Apakah quality function deployment (QFD) itu:

a.     Pola dalam analisis menunjukkan peluang untuk penetapan harga yang berbeda pada tiap tingkat produk per pelanggan berdasarkan kesediaan untuk membayar b. Teknik visualisasi data yang menunjukkan besarnya suatu fenomena sebagai warna dalam dua dimensi

c.     Teknik dari desain produk yang menerjemahkan kebutuhan pelanggan ke dalam rekayasa karakteristik

d.     Teknik untuk mengatasi kesenjangan komunikasi antara anggota fungsional yang berbeda dalam suatu tim

 

     M11

181.  Analisa yang berdasarkan pada data-data mengenai harga historis yang terjadi pada pasar saham, disebut:

a.     Analisis fundamental

b.     Analisis kredit

c.     Analisis keranjang pasar

d.     Analisis teknikal

 

182.  Praktik illegal dalam dunia investasi, di mana seorang investor mendapat informasi yang pasti perihal peluang keuntungan dalam transaksi jual beli saham. Kepastian informasi tersebut tentu bersumber dari orang dalam di perusahaan terkait, disebut : a. Bribery

b.     Insiden trading

c.     Money laundring

d.     Sanction breaches

 

183.  Data warehouse DJP dapat berupa data-data, kecuali

a.     Direct tax

b.     Data tradisional

c.     Indirect tax

d.     Transfer pricing

 

184.  Berikut adalah karakteristik big data, kecuali:

a.     Variety

b.     Capacity

c.     Velocity

d.     Volume

 

185.  Berikut merupakan contoh data konvensional

a.     Data stocks (saham)

b.     Data laporan keuangan perusahaan

c.     Data social media (twitter, facebook, youtube, dll)

d.     Data transaksi nasabah bank

186.  Di dalam perpajakan ada yang disebut dengan self assessment system, apa yang dimaksud self assessment system

a.     Peranan pemerintah sangat aktif dalam menentukan penerimaan pajak

b.     Wajib pajak punya otomatis penuh aktif dalam menjalankan kewajiban perpajakannya

c.     Pihak lain yang melakukan semua kewajiban perpajakan

d.     Pemerintah Bersama dengan wajib pajak aktif melaksanakan hak dan kewajiban perpajakan

 

187.  Metode ini merupakan metode eksplorasi yang mengubah data yang sangat besar menjadi pohon keputusan yang mempresentasikan suatu aturan, disebut :

a.     Chi-squared automatic interaction detection (CHAID)

b.     Classification and regression tree (CART)

c.     Neural network

d.     Multivariate adaptive regression spline (MARS)

 

188.  Jenis fraud yang korban terbesarnya adalah para pemegang sahan, adalah :

a.     Investment scam

b.     Customer fraud

c.     Management fraud

d.     Employee fraud

 

189.  Tools yang dapat digunakan untuk mengolah big data adalah :

a.     Excel

b.     SPSS

c.     Hadroop

d.     Integral

 

190.  Penerapan analisis big data dalam konteks penerimaan pajak memiliki banyak potensi, diantaranya kecuali:

a.     Memperkaya profil wajib pajak

b.     Dapat melihat relasi antar-wajib pajak

c.     Mengurangi risiko biaya

d.     Dapat mengidentifikasi risiko ketidakpatuhan setiap wajib pajak

 

191.  Teknik untuk membantu melihat pelanggan mana yang akan meninggalkan layanan sehingga          perusahaan      dapat mengembangkan         strategi            yang    tepat    untuk mempertahankan pelanggan, disebut :

a.     Segmentasi pelanggan

b.     Upselling

c.     Churn-prediction

d.     Credit scoring

192.  Contoh dari direct tax adalah

a.     Data wajib pajak penghasilan badan

b.     Data PPN

c.     Data CSR

d.     Data perbankan

 

193.  Rendahnya tingkat tax compliance jika dilihat dari big data adalah:

a.     Kualitas data yang tidak mendukung

b.     Big data belum di manfaatkan dengan optimal oleh otoritas pajak

c.     Perlunya memberikan insentif

d.     Rendahnya ketersediaan dana pajak

 

194.  Market basket analysis termasuk kelompok peran sains data pada industri keuangan : a. Bisnis real estate

b.     Bisnis melalui CRM

c.     Lainnya

d.     Manajemen risiko

 

195.  Tahapan dalam money laundry dimana sudah mulai digunakan mata uang digital, adalah tahap :

a.     Layering

b.     Integration

c.     Placement

d.     Credit scoring

 

196.  Kegunaan big data bagi pemerintah sangat penting, diantaranya :

a.     Menjadi biaya tinggi bagi pemerintah

b.     Meningkatkan pendapatan negara

c.     Memberikan peluang untuk melakukan rekayasa transaksi

d.     Merupakan sarana untuk menyembunyikan transaksi

 

197.  Mendorong konsumen untuk membeli model yang lebih mahal dalam brand atau kategori produk yang sama, atas untuk menambah model asli dengan fitur tambahan, disebut :

a.     Cross-selling

b.     Upselling

c.     Pre-selling

d.     Down-selling

 

198.  Berikut pemanfaatan data bagi DJP, kecuali:

a.     Data eksternal

b.     Data warehouse

c.     Internal data

d.     Data pribadi

199.  Tahapan algoritma C4.5 untuk membangun pohon keputusan setelah tahap “bagi kasus dalam cabang” adalah

a.     Membuat aturan asosiasi

b.     Pilih atribut sebagai akar

c.     Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama

d.     Buat cabang untuk masing-masing nilai

 

200.  Berikut ini yang termasuk klasifikasi variabel segmentasi yang tidak dapat diobservasi terkait produk-spesifik adalah :

a.     Preferensi

b.     Loyalitas

c.     Psikografik

d.     Demografi

 

     M12

201.  Apakah yang dimaksud dengan veracity dalam big data:

a.     Ukuran data

b.     Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data

c.     Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga d. Akurasi data

 

202.  Artificial intelligence pada tahun 1980 an – 2010 an berfokus pada:

a.     Jaringan neural

b.     Pembelajaran mesin

c.     Pembelajaran mendalam

d.     Memprediksi sinyal yang dibuat

 

203.  Apakah yang dimaksud dengan variety dan complexity dalam big data:

a.     Ukuran data

b.     Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data

c.     Akurasi data

d.     Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga

 

204.  Berikut ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:

a.     Penanganan bagasi

b.     Booking perjalanan

c.     Smart track system

d.     Komparasi tiket termurah

 

205.  Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola adalah definisi dari:

a.     Sains data

b.     Big data

c.     Kecerdasan buatan

d.     Artificial intelligence

 

206.  Apakah yang dimaksud dengan big data:

a.     Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur

b.     Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses

c.     Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola

d.     Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang tersembunyi

 

207.  Pendeteksi/pengklasifikasian cyberbullying adalah contoh implementasi artificial intellingence di bidang:

a.     Psikologi

b.     SDM

c.     Ritail

d.     Bahasa dan NLP

 

208.  Apakah yang dimaksud dengan sains data:

a.     Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur

b.     Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses

c.     Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang tersembunyi

d.     Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola

 

209.  Tujuan utama penggunaan artificial intellingence adalah :

a.     Monitoring aktivitas dan kondisi tubuh kita

b.     Untuk meningkatkan kemampuan manusia dengan membuat perangkat lebih mampu dan meningkat UX

c.     Menciptakan komputasi yang lebih personal, meningkatkan produktivitas, menemukan kembali proses bisnis, dan membangun platform cloud yang cerdas

d.     Streaming data

 

210.  Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang tersembunyi adalah definisi dari:

a.     Sains data

b.     Big data

c.     Kecerdasan buatan

d.     Artificial intelligence  

211.  Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola adalah definisi dari:

a.     Sains data

b.     Artificial intelligence

c.     Kecerdasan buatan

d.     Big data

 

212.  Apakah yang dimaksud dengan volume dalam big data:

a.     Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data

b.     Ukuran data

c.     Akurasi data

d.     Data dihasillkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga

 

213.  Artificial intelligence pada tahun 2011 – saat ini berfokus pada:

a.     Memprediksi sinyal yang dibuat

b.     Pembelajaran mendalam

c.     Pembelajaran mesin

d.     Jaringan neural

 

214.  Berikut ini adalah definisi artificial intelligence:

a.     Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang tersembunyi

b.     Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola

c.     Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses

d.     Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur

215.  Tool yang digunakan dalam sains data adalah:

a.     PyTorch

b.     Shogun

c.     R

d.     Kaffe

 

216.  Berikut ini adalah pernyataan yang benar mengenai last mile delivery:

a.     Jawaban tidak ada yang benar

b.     Konsep arsitektur yang mengintegrasikan teknologi dan mengumpulkan data untuk mengoptimalkan efisiensi operasi

c.     Cara yang digunakan distributor atau retailer untuk mengirim barang ke konsumen secara langsung tanpa menggunakan pihak ketiga

d.     Senjata tersembunyi yang memungkinkan seorang arsitek untuk mengubah parameter tertentu untuk membuat berbagai jenis desain

 

217.  Apakah yang dimaksud dengan velocity dalam big data:

a.     Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga

b.     Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data

c.     Ukuran data

d.     Akurasi data

 

218.  Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur adalah definisi dari:

a.     Kecerdasan buatan

b.     Sains data

c.     Artificial intelligence

d.     Big data

 

219.  Artificial intelligence pada tahun 1950 an – 1970 an berfokus pada:

a.     Pembelajaran mesin

b.     Jaringan neural

c.     Pembelajaran mendalam

d.     Memprediksi sinyal yang dibuat

 

220.  Apakah yang dimaksud dengan kecerdasan buatan:

a.     Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang tersembunyi

b.     Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang berorientasi pada proses

c.     Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur

d.     Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola

 

 

     M13

221.  Data cleaning, data integration, data reduction, data transformation adalah proses … pada data mining :

a.     Data scientist

b.     Data science application developer

c.     Data pre-processing

d.     Data analyst/business analyst

 

222.  Definisi supervised learning adalah, kecuali :

a.     Pembelajaran dengan guru, data set memiliki target/label/class

b.     Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning

c.     Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)

d.     Algoritma melakukan proses belajar berdasarkan nilai dari variable target yang terasosiasi dengan nilai dari variable prediktor

 

223.  Evolusi science (evolution of sciences) sebelum tahun 1600 adalah :

a.     Data science

b.     Theoretical science

c.     Computational science

d.     Empirical science

 

224.  Metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus dalam proses pembelajarannya adalah :

a.     Semi-Supervised learning

b.     Supervised learning

c.     Type of data

d.     Unsupervised learning

 

225.  Evolusi science (evolution of sciences) tahun 1600-1950 adalah :

a.     Empirical science

b.     Theoretical science

c.     Data science

d.     Computational science

 

226.  Evolusi science (evolution of science) tahun 1950-1990 adalah :

a.     Computational science

b.     Data science

c.     Theoretical science

d.     Empirical science

 

227.  Pembagian dataset pada pengujian model data mining adalah kecuali:

a.     Data training

b.     Data estimation

c.     Data validation

d.     Data testing

 

228.  FP-growth, A priori, coefficient of correlation, chi square adalah algoritma pada … didata mining :

a.     Classification

b.     Clustering

c.     Association

d.     Estimasi

 

229.  Evolusi science (evolution of science) tahun 1990 – now adalah :

a.     Data science

b.     Empirical science

c.     Computational science

d.     Theoretical science

 

230.  Definisi unsupervised learning adalah, kecuali :

a.     Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning

b.     Algoritma clustering adalah algoritma unsupervised learning

c.     Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)

d.     Algoritma data mining mencari pola dari semua variable (atribut)

 

231.  Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang :

a.     Customer segmentation

b.     Bioinformatics

c.     Muncul bersamaan

d.     Monitoring system

 

232.  Pola, rumus, aturan atau model yang muncul dari data adalah definisi dari:

a.     Data

b.     Informasi

c.     Sistem

d.     Pengetahuan

 

233.  Fakta yang terekam dan tidak membawa arti adalah definisi dari:

a.     Pengetahuan

b.     Informasi

c.     Sistem

d.     Data

 

234.  Peran utama data mining adalah sebagai berikut, kecuali :

a.     Prediksi

b.     Klastering

c.     Penetuan

d.     Estimasi

 

235.  Untuk pengujian model pada pengujian model data mining adalah :

a.     Data testing

b.     Data training

c.     Data estimation

d.     Data validation

 

236.  RapidMiner adalah :

a.     Manages daily operation of facilities and resources and responds to customer requests

b.     Designs and implements or monitors and maintains large-scale cloud databases

c.     Software data mining dan data analytics

d.     Manages daily operations of cloud storages, including related to data life cycle, and responds to requests from storage users

 

237.  Linear regression, neural network, support vector machine adalah algoritma pada … didata mining:

a.     Classification

b.     Clustering

c.     Estimasi

d.     Association

 

238.  Beberapa definisi data mining adalah, kecuali :

a.     Kegiatan   yang   meliputi pengumpulan,   pemakaian   data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar

b.     Extraction of interesting (non-trivial, implicit, previously unknown and potentially useful) patterns or knowledge from huge amount of data

c.     Melakukan esktraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data

d.     Searching for different sources of data and capturing structured and unstructured data

 

239.  Untuk pembentukan model pada pengujian model data mining adalah :

a.     Data testing

b.     Data validation

c.     Data estimation

d.     Data training

 

240.  Contoh penerapan data mining adalah sebagai berikut, kecuali :

a.     Penjadwalan pemeliharaan

b.     Analisis pola belanja pelanggan

c.     Penentuan pasokan listrik PLN untuk wilayah Jakarta

d.     Deteksi serangan (instrusion) pada suatu jaringan

 

 

         M14

241.  Amazon/Alexa, Microsoft/Cortana merupakan contoh pemanfaatan AI di Bahasa dengan teknologi

a.     Drone control

b.     Google translate

c.     Chat bot Al

d.     Smart speaker

 

242.  Apakah yang dimaksud dengan Variety dan Complexity dalam Big Data:

a.     Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data

b.     Ukuran data

c.     Akurasi data

d.     Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga

 

243.  Beda Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki "has problem solving skills, knowledge of basic statistic". Hal tersebut ada pada fitur : a. Skill

b.     Background

c.     Type of data

d.     Scope

 

244.  Berikut contoh penggunaan database pada lingkungan big data, kecuali : a. Exel

b.     Postgresql

c.     Hdfs

d.     Druid

 

245.  Berikut ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:

a.     Booking perjalanan

b.     Penanganan bagasi

c.     Smart track system

d.     Komparasi tiket termurah

246.  Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola merupakan definisis dari

a.     Metode numerik

b.     Sains data

c.     Artificial intelligence

d.     Kecerdasan buatan

 

247.  Bidang studi multidisiplin dengan tujuan untuk mengatasi tantangan dalam data besar adalah

a.     Metode numerik

b.     Kecerdasan buatan

c.     Sains data

d.     Artificial intelligence  

248.  Big data dapat membantu melakukan predictive maintenance & quality pada industry a. Banking

b.     Education

c.     Agriculture

d.     Automotive

 

249.  Contoh Pemanfaatan AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010 dengan menggunakan teknologi Internet adalah

a.     Internet informasi travel

b.     Blog, SNS two way communication

c.     ICT smart tourism

d.     Computer reservasi berbasis computer

 

250.  Contoh Platform Online for FIT (Fully Independent Traveler) pada akomodasi adalah a. Gojek

b.     Google

c.     Airbnb

d.     Maps

 

251.  Definisi Supervised Learning adalah, kecuali :

a.     Algoritma melakukan proses belajar berdasarkan nilai dari variable target yang terasosiasi dengan nilai dari variable predictor

b.     Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)

c.     Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning

d.     Pembelajaran dengan guru, data set memiliki target/label/class

 

252.  Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur adalah definisi dari:

a.     Artificial intelligence

b.     Big data

c.     Kecerdasan buatan

d.     Sains data

 

253.  Jenis Machine Learning berdasarkan campur tangan manusia adalah

a.     Reinforcement learning

b.     Batch learning

c.     Model based learning

d.     Instance based learning

 

254.  Pemanfaatan AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010 dengan menggunakan teknologi

a.     Computer

b.     Internet

c.     ICT

d.     Blog, SNS

 

255.  Pendeteksi/Pengklasifikasian Cyberbullying adalah contoh implementasi Artificial Intelligence di bidang:

a.     Bahasa dan NLP

b.     SDM

c.     Ritail

d.     Psikologi

 

256.  Penerapan utama data dari data science pada e-commerce adalah melakukan hal-hal berikut kecuali :

a.     Identifying consumers

b.     Prediction potential problem

c.     Analyzing reviews

d.     Recommending product

 

257.  Sains Data adalah multi disiplin dari:

a.     Datawarehouse, datamining

b.     Statistical model, statistical computing

c.     Application web, application desktop

d.     Hardware, software

 

258.  Sebuah sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan platform online yang berbasis teknologi big data menggunakan keahlian Artificial

Intelligence dan Natural Learning Process (NLP) adalah

a.     Drone emprit

b.     Data science

c.     Social network analysis

d.     Corpus

 

259.  Teknik pada Machine Learning adalah, kecuali :

a.     Unsupervised learning

b.     Improvement learning

c.     Reinforcement learning

d.     Supervised learning

 

260.  Tujuan Pengunaan robot dan IOT untuk suatu even sebagai salah satu Revolusi

Industri 4.0 dan Pariwisata adalah

a.     Mengurangi user

b.     Efesiensi biaya operasi

c.     Berbagi pengalaman baru

d.     Personalisasi pengalaman wisatawan

Comments