Biotechnologia.pl
łączymy wszystkie strony biobiznesu
Chemometryczne metody przetwarzania danych w laboratorium

Ilość przetwarzanych każdego dnia danych jest tak ogromna, że aby były dla nas użyteczne, niezbędne okazały się odpowiednie narzędzia statystyczne i numeryczne. Korzysta z nich również branża chemiczna. Wykorzystywanie metod numerycznych, statystycznych oraz symbolicznych do analizy zbioru danych chemicznych nazywane jest chemometrią. Jest to niezwykle złożona dziedzina chemii, jednakże niezbędna szczególnie w wyspecjalizowanych laboratoriach analitycznych i jednostkach naukowych.

 

Podstawowe założenia chemometrii

Chemometria to ważny obszar chemii pozwalający na sprawne opracowywanie danych analitycznych. Jako dyscyplina chemiczna wykorzystuje metody matematyczne, statystyczne oraz numeryczne do projektowania lub wyboru optymalnych procedur pomiarowych i eksperymentalnych oraz analizy dużej ilości danych, w celu dostarczenia maksymalnej liczby użytecznych informacji chemicznych.

Przykładowe zastosowania chemometryczne to:

* zapewnienie, że gromadzone dane są odpowiednie do założonych osiągnięć,

* ocena i interpretacja danych chemicznych,

* budowanie użytecznych modeli, które przewidują wyniki przyszłych eksperymentów,

* wyodrębnianie z danych chemicznych ukrytych, ale analitycznie użytecznych informacji poprzez znajdowanie wzorców danych.

Chemometria często jest traktowana na równi ze statystyką matematyczną. Mimo, że te dwa zagadnienia dużo łączy, są one jednak odrębnymi obszarami nauki. Podstawową różnicą między nimi jest liczba zmiennych, jakimi się zajmują. Podczas gdy statystyka analizuje pojedyncze zmienne (lub bardzo niewielką ich ilość), chemometria z góry zakłada analizę dużej ilości zmiennych. Postęp technologiczny pozwala obserwować szybki rozwój np. technik chromatograficznych. Dzięki temu obecnie możliwe jest jednoczesne analizowanie dużej ilości analitów, przy znacznym obniżeniu granic wykrywalności i satysfakcjonującej selektywności. Niewątpliwie zwiększa to możliwości badawcze, a chemikom dostarcza znacznej ilości danych, z których czasami tylko niewielki zakres jest użyteczny. Dane te również trudno zwizualizować przy pomocy tradycyjnych metod. Wtedy z pomocą przychodzi chemometria. Szczególną cechą chemometrii jest również to, że jej założenia powinny być obecne na każdym etapie badania lub eksperymentu, gdyż tylko takie podejście gwarantuje uzyskanie użytecznych danych.

Podstawowe pojęcia i zagadnienia poruszane w chemometrii to m.in.:

* zbiory wielowymiarowe,

* metody wstępnej kontroli danych chemometrycznych,

* planowanie doświadczeń,

* transformacje zmiennych,

* normalizacja rozkładów,

* zastosowanie testów statystycznych,

* badanie korelacji i kowariancji pomiędzy zmiennymi,

* analiza podobieństwa,

* regresja liniowa jednej lub wielu zmiennych i inne.

Techniki chemometryczne

Podstawowym zadaniem chemometrii jest wydobycie użytecznych informacji z wykorzystaniem metod statystycznych i matematycznych. Ich wachlarz jest stosunkowo szeroki. Techniki te stanowią niezwykle cenne narzędzie dla chemika. Poniżej krótko scharakteryzowano wybrane przykłady.

Planowanie doświadczeń

Niewątpliwie najważniejszym etapem w eksperymentach chemicznych jest ich właściwe zaplanowanie. Nieprzemyślane wykonywanie serii pomiarów w procesie badawczym jest szczególnie nierozsądne i skutkuje najczęściej poniesieniem niepotrzebnych kosztów na zdobycie danych, których statystyczne opracowanie nie przyniesie poszukiwanych informacji. Planowanie doświadczeń w oparciu o metody chemometryczne opiera się przede wszystkim na wyborze optymalnej liczby pomiarów oraz jak najlepszym rozmieszczeniu punktów pomiarowych. Realizacja tych założeń wiąże się w pewnym sensie z szukaniem kompromisu pomiędzy czasochłonnością badań oraz ich kosztem a nieuniknioną niepewnością pomiarów.

Analiza głównych składników (PCA)

Analiza głównych składników (z ang. principal component analysis, PCA) jest jedną z metod pozwalających na zredukowanie dużej liczby zmiennych do kilku kluczowych. Umożliwia to wyeliminowanie nadmiernej korelacji zmiennych. Analiza PCA opiera się głównie na macierzy korelacji lub macierzy kowariancji. Zredukowana wielowymiarowość zbioru danych w stosunkowo przejrzysty sposób pozwala na ich przedstawienie na płaszczyźnie (2D) lub w trójwymiarowej przestrzeni (3D). Zatem finalnie w analizie głównych składowych otrzymuje się nowy układ nieskorelowanych zmiennych, których punktami wyjściowymi są pierwotne zmienne objaśniające.

Analiza skupień (PA)

Analiza skupień (z ang. pattern recognition, PA) wykorzystuje w swoich metodach szereg algorytmów, w celu odpowiedniego grupowania ze sobą zmiennych o zbliżonych cechach. Grupowanie danych w odrębne klastry odbywa się w oparciu o różne algorytmy. Ich wybór jest uzależniony od ilości informacji, jaka jest dostępna na temat danego obiektu. Pierwszy ze sposobów rozpoznawania wzorców to rozpoznawanie nienadzorowane, a drugi – rozpoznawanie nadzorowane. Do każdego z nich przypisane są odpowiednie algorytmy, według których powstają klastry. Rozpoznawanie nienadzorowane zwykle jest wykorzystywane, gdy nie są dostępne informacje na temat struktury zbioru danych. Wtedy też przeprowadza się wstępną analizę podobieństw. Natomiast do rozpoznawania nadzorowanego konieczna jest przynajmniej podstawowa wiedza na temat zbioru elementów w rozpatrywanym obiekcie. Zwykle w przypadku tego sposobu ilość powstających klastrów (grup) jest z góry zakładana.

Sztuczne sieci neuronowe (ANN)

Sztuczne sieci neuronowe (z ang. artificial neural networks, ANN) stosowane są wszędzie tam, gdzie pomiędzy zmiennymi zależnymi i niezależnymi występują pewne korelacje, nawet jeśli ich natura jest bardzo skomplikowana i trudno jest je przedstawić w klasyczny sposób. Ich działanie porównuje się do zależności zachodzących w mózgu człowieka. Sztuczne sieci neuronowe nie opierają się na sprecyzowanych algorytmach, ale w tym przypadku niezbędne jest wprowadzenie systemu uczenia z wykorzystaniem odpowiednich bodźców. W chemii takie rozwiązania mogą zostać wykorzystane chociażby do modelowania zależności pomiędzy wybranymi cechami fizykochemicznymi. Należy jednak zaznaczyć, że jest to stosunkowo nowa metoda numeryczna, obecnie wykorzystywana jedynie do wybranych zastosowań.

Praktyczne znaczenie analizy chemometrycznej

Chemometria od wielu lat jest ważnym narzędziem we współczesnym przemyśle chemicznym i farmaceutycznym. Świadczy o tym nie tylko stale rosnąca liczba publikacji z tej dziedziny nauki, ale również implementacja narzędzi chemometrycznych dla ośrodków przemysłowych i kontroli jakości. Wykorzystanie chemometrii w laboratorium rozpoczyna się już chociażby na etapie kalibracji metody analitycznej lub przyrządu pomiarowego, czyli stworzenia matematycznego modelu na podstawie zbioru danych. Chemometria jest obecna również w trakcie interpretacji wyników, gdzie przeprowadzana jest tzw. analiza rozpoznawcza. Obecnie metody chemometryczne są wykorzystywane do: analizy zależności przyczynowo-skutkowych, projektowania nowych substancji, optymalizacji procesów przemysłowych, kontroli jakości, wprowadzania skutecznych metod dokumentowania wyników i wielu innych. Na rynku dostępnych jest coraz więcej specjalistycznych systemów komputerowych, które realizują metody chemometryczne.

Źródła

1. Kupis, J.; Skowron-Jaskólska, M.; Szczukocki, D.; Krawczyk, B. Metrologia i chemometria w analityce środowiska; 2016.

2. Otto, M. What is Chemometrics? In Chemometrics; 2007; pp. 113. 

3. González-Domínguez, R.; Sayago, A.; Fernández-Recamales, Á. An Overview on the Application of Chemometrics Tools in Food Authenticity and Traceability. Foods 2022, 11, 1-13, doi:10.3390/foods11233940.

4. Farmaceutycznej, O.A.; Czy, P.; Ność, K. Chemometria w technologii oraz analizie farmaceutycznej – potrzeba czy konieczność? 57-68.

Fot. https://pixabay.com/pl/illustrations/okr%C4%85%C5%BCenie-sze%C5%9Bciok%C4%85tny-geometryczny-7955446/

KOMENTARZE
Newsletter