Studia Informatica (E-Journal)
Not a member yet
712 research outputs found
Sort by
Analiza wydajności przetwarzania danych w chmurze obliczeniowej Windows Azure
The paper presents the results of performance tests for solving the traveling salesman problem with the use of a parallel version of a genetic algorithm on a local multi-core server, and in the Windows Azure cloud. The analysis of the obtained results allows the selection of a suitable configuration of the servers in the cloud.W artykule przedstawiono wyniki badań wydajnościowych dla rozwiązania problemu komiwojażera z wykorzystaniem zrównoleglonej wersji algorytmu genetycznego w środowisku wielordzeniowego serwera lokalnego oraz chmury obliczeniowej Windows Azure. Przeprowadzona analiza wyników umożliwia również dobranie odpowiedniej do określonych zastosowań konfiguracji serwerów w chmurze
Skalowalność wydajności operacji bazodanowych w systemach z procesorami wielordzeniowymi
This article presents tests of three popular, public domain, database systems: PostgreSQL, MySQL and Firebird. We are examine the impact on performance of each database the number of cores in the processor. The tests were performed by measuring the execution time of individual DML queries of varying complexity. In addition, the load test was performed by the single query executed multiple times.Artykuł opisuje testy wydajności trzech popularnych wolno dostępnych systemów baz danych: PostgreSQL, MySQL oraz Firebird. Testami objęto wpływ liczby rdzeni w procesorze na wydajność pracy każdej bazy. Testy Przeprowadzono przez pomiar czasu wykonania pojedynczych zapytań DML o różnym stopniu skomplikowania. Dodatkowo przetestowano obciążenia przez wielokrotne zadanie tego samego zapytania
Scenariusze użycia systemu MAS4PSi w diagnostyce medycznej
MAS4PSi (Multi-Agent System For Protein Similarity searching) is a system that allows fast, scalable and reliable protein structure similarity searching. Protein structure similarity searching is crucial in conducting research on a variety of biological processes, and other areas that have their basis in these biological processes. The purpose of this article is to define and present possible scenarios of using the MAS4PSi system in a broadly understood medical diagnostics, both in the design of experiments supporting new research, as well as the typical diagnostic stage.System MAS4PSi (Multi Agent System For Protein Similarity searching) pozwala na szybkie, skalowalne i niezawodne poszukiwanie podobieństwa strukturalnego białek. Poszukiwanie podobieństwa strukturalnego białek jest kluczowe w prowadzeniu badań nad różnymi procesami biologicznymi i innymi obszarami, które mają swoją podstawę w tych procesach biologicznych. Celem niniejszego artykułu jest przybliżenie i określenie możliwych scenariuszy wykorzystania zbudowanego systemu MAS4PSi w powszechnie rozumianej diagnostyce medycznej zarówno na etapie opracowywania eksperymentów pomocnych we wprowadzeniu nowych badań, jak i na etapie typowo diagnostycznym
Analiza genów opisanych przez ontologię Gene Ontology w środowisku grafowej bazy danych
The article presents evaluation of the application of Neo4j graph database to Gene Ontology graph analysis. Graph-based term similarity measures are calculated in order to assess the effectiveness of the system. Two types of common ancestor search are presented and evaluated, and parallel execution of the analysis is also evaluated.Artykuł przedstawia ocenę zastosowania grafowej bazy danych Neo4j do analizy grafu ontologii Gene Ontology. Ocena systemu została przeprowadzona na podstawie obliczenia bazujących na analizie grafu miar podobieństwa terminów ontologii. Przedstawione i ocenione zostały dwa sposoby wyszukiwania rodziców w grafie. Analizie poddano również równoległą realizację badanych algorytmów
Wykorzystanie metod morfologii matematycznej w procesie generalizacji baz danych przestrzennych
This article describes the issue of geometric objects generalization in spatial databases with methods of mathematical morphology. The authors studied the impact of exemplary operations, i.e.: erosion, dilatation, opening, closing on the level of the data details and time efficiency of queries. It has been shown that the mathematical morphology methods can be successfully treated as a novel approach in spatial databases optimization.Niniejszy artykuł porusza temat generalizacji obiektów geometrycznych w bazach danych przestrzennych, na podstawie metod morfologii matematycznej. Zbadano wpływ przykładowych operacji, tj.: erozji, dylatacji, otwarcia i zamknięcia, na stopień szczegółowości danych oraz efektywności czasowej zapytań. Wykazano, iż metody morfologii matematycznej w połączeniu z algorytmami redukcji wierzchołków mogą być traktowane z powodzeniem jako nowatorskie podejście w procesie optymalizacji baz danych przestrzennych
M2HSE - metoda estymacji selektywności pewnej klasy zapytań zakresowych oparta na wielowymiarowym rozkładzie wartości atrybutów oraz rozkładach brzegowych
Selectivity is a parameter obtained by database query optimizer for early estimation of size of data that satisfying a query condition. This is needed for finding the optimal query execution plan. Commonly, selectivity is estimated using histograms that are non-parametric estimators of attribute values distribution. Obtaining a selectivity for a query with a selection condition bases on a few attributes requires a multimensional histogram estimating joint distribution. Accuracy of multidimensional histograms decreases for high dimensions. It is well-known as the curse of dimensionality problem. One-dimensional histograms describing marginal distributions are more accurate, but they do not describe dependency between attributes. In this paper we propose a method of selectivity estimation based on both types of histograms describing either a multidimensional joint distribution or marginal ones. The method (named M2HSE) may be used for some kind of queries with a range selection condition based on many attributes. For such kind of queries, this method may give more accurate selectivity estimations than classical methods based on multidimensional histogram only or marginal histograms only (where the AVI rule is assumed).Selektywność jest parametrem wyznaczanym przez bazodanowy optymalizator zapytań w celu wczesnego oszacowania rozmiaru danych spełniających warunek zapytania. Jest to czynność niezbędna do znalezienia optymalnego planu wykonania zapytania. Selektywność jest na ogół oszacowywana na podstawie histogramów, które są nieparametrycznymi estymatorami rozkładów wartości atrybutów. Wyznaczanie selektywności dla zapytań z warunkiem selekcji opartym na kilku atrybutach wymaga wykorzystania wielowymiarowego histogramu estymującego łączny rozkład wartości atrybutów. Dokładność histogramów wielowymiarowych spada wraz ze wzrostem liczby wymiarów, co jest powszechnie znane pod nazwą problemu przekleństwa wymiarowości. Natomiast jednowymiarowe histogramy zbudowane dla pojedynczych atrybutów, które charakteryzują rozkład brzegowy, opisują ten jednowymiarowy rozkład dokładniej, ale oczywiście nie opisują zależności pomiędzy atrybutami. W niniejszym artykule zaproponowano metodę wyznaczania selektywności, opartą na histogramach opisujących zarówno rozkład łączny, jak i rozkłady brzegowe. Zaproponowana metoda (nazwana M2HSE) dotyczy pewnej klasy zapytań, w których zakresowy warunek selekcji oparty jest na wielu atrybutach. Dla takich zapytań przedstawiona metoda może pozwolić na wyznaczenie dokładniejszych przybliżeń wartości selektywności niż klasyczne metody, wykorzystujące histogramy opisujące tylko rozkład łączny albo tylko rozkłady brzegowe (gdzie zastosowane jest założenie o niezależności atrybutów)
Perspektywy zastosowań metod statystycznych w konstrukcji strategii działania na rynkach kapitałowych – wykorzystanie systemów hierarchicznych oraz regularyzacji
The paper describes concept of operations on capital markets based on the parameterized family of decision rules. Selection of rules is carried out by multi-level optimization, which leads to a system with hierarchical structure. An empirical evaluation of proposed method is presented, together with proposals for expansion using regularization.Artykuł opisuje koncepcję operacji na rynkach kapitałowych, w szczególności instrumentów pochodnych, opartą na parametryzowanej rodzinie reguł decyzyjnych. Dobór parametrów reguł odbywa się na drodze wielopoziomowej optymalizacji, co prowadzi do systemów o strukturze hierarchicznej. Przedstawiono empiryczną ocenę proponowanych metod, a także propozycję ich rozszerzeń z wykorzystaniem między innymi koncepcji regularyzacji
System informatyczny wspomagający podejmowanie decyzji w przedsiębiorstwie produkcyjnym oraz sposoby jego oceny
The increase in production scale, technology level entailed that industrial companies have become complex systems that require the use of modern and more accurate methods of decision making. These methods use artificial intelligence techniques, which allows to predict, explain and control the decision making processes. This article focuses on issues related to decision-making and knowledge acquisition in enterprises. The paper presents the structure Intelligent Decision Support Systems its position in the technological process in the company. And finally an attempt to assess such systems was made.Wzrost skali produkcji i poziomu technologicznego spowodowały, że przedsiębiorstwa przemysłowe stały się złożonymi systemami, które wymagają stosowania nowoczesnych, coraz bardziej precyzyjnych metod podejmowania decyzji. Metody te wykorzystują techniki sztucznej inteligencji, które pozwalają przewidywać, wyjaśniać i sterować procesami decyzyjnymi. Artykuł koncentruje się na omówieniu zagadnień związanych z podejmowaniem decyzji w przedsiębiorstwach oraz pozyskiwaniem wiedzy. Przedstawiono strukturę Inteligentnego Systemu Wspomagania Decyzji (ISWD) oraz jego umiejscowienie w procesie technologicznym w przedsiębiorstwie. Na koniec podjęto próbę oceny takich systemów
Indeksowanie tabel dla grupowych zapytań SQL z uwzględnieniem kryterium rozmiaru
This paper discusses the problem of minimizing the response time for a given database workload by a proper choice of indexes. The main objective of our contribution is to illustrate the database queries as a group and search for good indexes for the group instead of an individual query, including the size criterion. Examples illustrate that the use of a group approach can reduce queries block execution time of 30% compared to classical methods.Indeksowanie jest kluczowym elementem optymalizacyjnym systemów relacyjnych baz danych. Komercyjne narzędzia doboru indeksów (np. Toad, SQL Server Database Tuning Advisor) działają na podstawie metod przeznaczonych dla pojedynczych zapytań. W artykule przedstawiono podejście indeksowania tabel w ramach grupowych zapytań SQL uwzględniające kryterium rozmiaru indeksów. Przedstawione przykłady ilustrują, że zastosowanie podejścia grupowego pozwala zmniejszyć czas wykonania zapytań nawet o 30% w stosunku do rozwiązań uzyskanych klasycznymi metodami
Identyfikacja powiązań pomiędzy kategoriami Wikipedii z użyciem miar podobieństwa artykułów
In the article we present an approach to identification of relations between categories organizing the repository of documents. We describe the metrics of category relevance based on similarity measures between articles. The metrics have been used to discover relations between categories within Wikipedia repository. The evaluation of the proposed method indicate it allows to reconstruct already existing associations in category structure as well as introduce new significant relations.W artykule opisano podejście do identyfikacji powiązań między kategoriami w repozytorium danych tekstowych, bazując na Wikipedii. Przeprowadzając analizę podobieństwa między artykułami, określono miary pozwalające zidentyfikować powiązania między kategoriami, które nie były wcześniej uwzględnione, i nadawać im wagi określające stopień istotności. Przeprowadzono automatyczną ocenę uzyskanych rezultatów w odniesieniu do już istniejącej struktury kategorii