Optimized feature construction methods for data summarization methods for data summarization of relational data

Terdapat banyak pendekatan telah dibangunkan untuk mendapat pengetahuan (iaitu maklumat yang berguna) daripada data yang disimpan di dalam pangkalan data berjadual. Penggabungan Dinamik Atribut Hubungan (Dynamic Aggregation of Relational Attributes - DARA) algoritma merupakan salah satu pendekatan d...

Full description

Bibliographic Details
Main Author:	Florence Sia, Fui Sze
Format:	Thesis
Language:	English
Published:	2014
Subjects:	QA76 Computer software
Online Access:	http://umpir.ump.edu.my/id/eprint/12080/ http://umpir.ump.edu.my/id/eprint/12080/ http://umpir.ump.edu.my/id/eprint/12080/1/FLORENCE%20SIA%20FUI%20SZE.PDF

id	ump-12080
recordtype	eprints
spelling	ump-120802016-03-22T03:00:04Z http://umpir.ump.edu.my/id/eprint/12080/ Optimized feature construction methods for data summarization methods for data summarization of relational data Florence Sia, Fui Sze QA76 Computer software Terdapat banyak pendekatan telah dibangunkan untuk mendapat pengetahuan (iaitu maklumat yang berguna) daripada data yang disimpan di dalam pangkalan data berjadual. Penggabungan Dinamik Atribut Hubungan (Dynamic Aggregation of Relational Attributes - DARA) algoritma merupakan salah satu pendekatan diperkenalkan untuk merumuskan data yang disimpan di dalam jadual sasaran yang mempunyai hubungan satu-ke-banyak dengan data yang disimpan di dalam jadual bukan sasaran melalui proses transformasi daripada data hubungan perwakilan ke ruang vektor perwakilan dan proses pengelompokan digunakan untuk mengumpulkan data berdasarkan persamaan ciri-ciri yang terdapat di dalam data. Hasil rumusan data akan dijadikan sebagai input data kepada mana-mana algoritma pengelasan untuk melaksanakan tugas klasifikasi. Klasifikasi merupakan satu tugas yang biasanya dilakukan untuk memperoleh pola dalam data yang boleh digunakan untuk pengelasan data yang baru. Di dalam DARA, ketepatan pengelasan data yang diperolehi daripada tugas klasifikasi boleh terjejas disebabkan oleh ketepatan deskritif rumusan data, DARA. Ketepatan deskritif rumusan data DARA adalah sangat dipengaruhi oleh perwakilan rekod bukan sasaran dalam bentuk model ruang vektor. Pembinaan attribut telah menunjukkan kemampuan untuk memperkayakan perwakilan rekod bukan sasaran dan dengan itu, meningkatkan ketepatan deskriptif rumusan data. Tetapi kaedah pembinaan attribut yang digunakan di dalam DARA adalah tidak begitu berkesan kerana DARA tidak meneroka semua perwakilan rekod yang mungkin berpotensi tinggi untuk dihasilkan. Di dalam tesis ini, kaedah pembinaan attribut baru diperkenalkan dan persoalan sama ada ketepatan deskriptif rumusan data boleh mendapat manfaat daripada kaedah pembinaan attribut baru disiasat. Rangka kerja yang dicadangkan melibatkan pengunaan algoritma genetik serta beberapa Jenis kaedah pemarkahan attribut untuk mengoptimasikan proses pembinaan attribut. Tesis ini juga membentangkan kajian berkaitan dengan kaedah untuk meningkatkan ketepatan deskriptif algoritma DARA melalui perumusan data secara gandaan. Keputusan empirik menunjukkan bahawa ketepatan pengelasan dapat ditingkatkan dan dengan itu, ketepatan deskriptif rumusan data boleh mendapat manfaat daripada kaedah yang dicadangkan. Kaedah tersebut menyediakan ruang carian yang lebih luas untuk mendapatkan cara perwakilan yang lebih relevan bagi mewakili rekod di dalam jadual bukan sasaran. 2014 Thesis NonPeerReviewed application/pdf en http://umpir.ump.edu.my/id/eprint/12080/1/FLORENCE%20SIA%20FUI%20SZE.PDF Florence Sia, Fui Sze (2014) Optimized feature construction methods for data summarization methods for data summarization of relational data. Masters thesis, Universiti Malaysia Sabah. http://iportal.ump.edu.my/lib/item?id=chamo:87773&theme=UMP2
repository_type	Digital Repository
institution_category	Local University
institution	Universiti Malaysia Pahang
building	UMP Institutional Repository
collection	Online Access
language	English
topic	QA76 Computer software
spellingShingle	QA76 Computer software Florence Sia, Fui Sze Optimized feature construction methods for data summarization methods for data summarization of relational data
description	Terdapat banyak pendekatan telah dibangunkan untuk mendapat pengetahuan (iaitu maklumat yang berguna) daripada data yang disimpan di dalam pangkalan data berjadual. Penggabungan Dinamik Atribut Hubungan (Dynamic Aggregation of Relational Attributes - DARA) algoritma merupakan salah satu pendekatan diperkenalkan untuk merumuskan data yang disimpan di dalam jadual sasaran yang mempunyai hubungan satu-ke-banyak dengan data yang disimpan di dalam jadual bukan sasaran melalui proses transformasi daripada data hubungan perwakilan ke ruang vektor perwakilan dan proses pengelompokan digunakan untuk mengumpulkan data berdasarkan persamaan ciri-ciri yang terdapat di dalam data. Hasil rumusan data akan dijadikan sebagai input data kepada mana-mana algoritma pengelasan untuk melaksanakan tugas klasifikasi. Klasifikasi merupakan satu tugas yang biasanya dilakukan untuk memperoleh pola dalam data yang boleh digunakan untuk pengelasan data yang baru. Di dalam DARA, ketepatan pengelasan data yang diperolehi daripada tugas klasifikasi boleh terjejas disebabkan oleh ketepatan deskritif rumusan data, DARA. Ketepatan deskritif rumusan data DARA adalah sangat dipengaruhi oleh perwakilan rekod bukan sasaran dalam bentuk model ruang vektor. Pembinaan attribut telah menunjukkan kemampuan untuk memperkayakan perwakilan rekod bukan sasaran dan dengan itu, meningkatkan ketepatan deskriptif rumusan data. Tetapi kaedah pembinaan attribut yang digunakan di dalam DARA adalah tidak begitu berkesan kerana DARA tidak meneroka semua perwakilan rekod yang mungkin berpotensi tinggi untuk dihasilkan. Di dalam tesis ini, kaedah pembinaan attribut baru diperkenalkan dan persoalan sama ada ketepatan deskriptif rumusan data boleh mendapat manfaat daripada kaedah pembinaan attribut baru disiasat. Rangka kerja yang dicadangkan melibatkan pengunaan algoritma genetik serta beberapa Jenis kaedah pemarkahan attribut untuk mengoptimasikan proses pembinaan attribut. Tesis ini juga membentangkan kajian berkaitan dengan kaedah untuk meningkatkan ketepatan deskriptif algoritma DARA melalui perumusan data secara gandaan. Keputusan empirik menunjukkan bahawa ketepatan pengelasan dapat ditingkatkan dan dengan itu, ketepatan deskriptif rumusan data boleh mendapat manfaat daripada kaedah yang dicadangkan. Kaedah tersebut menyediakan ruang carian yang lebih luas untuk mendapatkan cara perwakilan yang lebih relevan bagi mewakili rekod di dalam jadual bukan sasaran.
format	Thesis
author	Florence Sia, Fui Sze
author_facet	Florence Sia, Fui Sze
author_sort	Florence Sia, Fui Sze
title	Optimized feature construction methods for data summarization methods for data summarization of relational data
title_short	Optimized feature construction methods for data summarization methods for data summarization of relational data
title_full	Optimized feature construction methods for data summarization methods for data summarization of relational data
title_fullStr	Optimized feature construction methods for data summarization methods for data summarization of relational data
title_full_unstemmed	Optimized feature construction methods for data summarization methods for data summarization of relational data
title_sort	optimized feature construction methods for data summarization methods for data summarization of relational data
publishDate	2014
url	http://umpir.ump.edu.my/id/eprint/12080/ http://umpir.ump.edu.my/id/eprint/12080/ http://umpir.ump.edu.my/id/eprint/12080/1/FLORENCE%20SIA%20FUI%20SZE.PDF
first_indexed	2023-09-18T22:13:19Z
last_indexed	2023-09-18T22:13:19Z
_version_	1777415172758962176

Optimized feature construction methods for data summarization methods for data summarization of relational data

Similar Items