liveplace.gr - Science

Αναζήτηση στο Διαδίκτυο με κβαντικά μαθηματικά

View Comments
Μία μαθηματική τεχνική για τη μελέτη της αταξίας στα κβαντικά συστήματα ενδεχομένως να μπορούσε να βελτιώσει τη συμβατική αναζήτηση στο διαδίκτυο όπως αυτή εφαρμόζεται μέχρι τώρα με τις λέξεις-κλειδιά.

Έχει τη δυνατότητα να εντοπίζει σημαντικά πρότυπα σε μεγάλες ενότητες δεδομένων, όπως οι ιστοσελίδες και τα έγγραφα κειμένων, ενώ επιπλέον ίσως να μπορούσε να προσαρμοστεί και για την εξυπηρέτηση των αναγκών της ανάλυσης του συνόλου του γενετικού υλικού ή γενώματος.

Η συμβατική τεχνική για την αναζήτηση της λέξης-κλειδί συγκρίνει τη συχνότητα της λέξης σε ένα κείμενο με τις συχνότητες σε ένα συγκεκριμένο σώμα κειμένων από πολλές πηγές. Εάν μία λέξη στο κείμενο παρουσιάζεται συχνότερα από το κανονικό, θεωρείται σημαντική.

Η νέα μέθοδος εκτιμά τη σημασία των λέξεων σε ένα κείμενο με βάση το πού εμφανίζονται, και όχι απλώς με βάση το πόσες φορές εμφανίζονται. «Θα πρέπει να είσαι ικανός να εντοπίσεις την ουσιαστική αξία ενός βιβλίου, χωρίς να χρειάζεται να το συγκρίνεις με άλλα βιβλία,» σημειώνει ο Pedro Carpena, φυσικός στο Πανεπιστήμιο της Μάλαγα στην Ισπανία.

Ο Carpena στο παρελθόν χρησιμοποίησε τα μαθηματικά του τομέα της θεωρίας των τυχαίων μητρών για την ανάλυση κβαντικών συστημάτων. Σήμερα, αυτή η θεωρία μπορεί να βρει εφαρμογή στην αναζήτηση και εντοπισμό λέξεων-κλειδιά σε κείμενα.

Οι σημαντικές λέξεις τείνουν να δημιουργούν συστάδες, λέει ο Carpena, ενώ οι λιγότερο σημαντικές λέξεις εμφανίζονται πιο αραιά. Αυτό συμβαίνει διαισθητικά, και προσθέτει: καθώς οι συγγραφείς αναπτύσσουν σημαντικές ιδέες, τείνουν να χρησιμοποιούν σχετικές λέξεις πολλές φορές στην ίδια παράγραφο ή σελίδα, προτού προχωρήσουν σε άλλες ιδέες. Οι λιγότερο σημαντικές λέξεις όπως το «και» και το «αλλά» τείνουν να εμφανίζονται πιο στρωτά μέσα στο κείμενο.

Από τους ελέγχους που έχει πραγματοποιήσει μέχρι τώρα ο Carpena, η τεχνική φαίνεται να έχει αποτέλεσμα. Χρησιμοποιώντας τη θεωρία των τυχαίων μητρών για να εξάγει λέξεις-κλειδιά από το βιβλίο του Άλμπερτ Αινστάιν "Σχετικότητα: Η ειδική και η γενική θεωρία", βρήκε ότι οι λέξεις «σύμπαν», «πεδίο», «βαρυτικό», και «ενέργεια» βρίσκονταν ανάμεσα στις 10 πρώτες.

Η μέθοδος μπόρεσε να εξάγει ενδιαφέρουσες λέξεις-κλειδιά ακόμα και όταν ο Carpena αφαίρεσε τα κενά διαστήματα ανάμεσα στις λέξεις ενός κειμένου και ζήτησε από τον υπολογιστή να αναγνωρίσει σημαντικούς συνδυασμούς γραμμάτων, μήκους 2 έως και 35 χαρακτήρων. Το αποτέλεσμα αυτό υπονοεί ότι η μέθοδος ίσως αποβεί λειτουργική και για πιο αφηρημένες ομάδες δεδομένων. Ο Carpena και οι συνεργάτες του δοκιμάζουν τώρα την ιδέα στο ανθρώπινο γένωμα για να δουν εάν θα ανακαλύψουν ενδιαφέρουσες πληροφορίες σχετικά με τα γονίδια.

Δεν είναι ξεκάθαρο το αν η μέθοδος αναζήτησης αποβεί ανώτερη από τις ήδη υπάρχουσες, λέει ο Oren Etzioni, επιστήμονας πληροφορικής στο Πανεπιστήμιο της Ουάσιγκτον στο Σηάτλ. Σημειώνει το γεγονός ότι ο Carpena δεν έχει ακόμη συγκρίνει τη μέθοδο του με τις ήδη εφαρμόσιμες.

«Συχνά γίνονται μεγάλες ανακαλύψεις όταν τεχνικές που χρησιμοποιούνται σε μία επιστήμη δοκιμάζονται σε μια άλλη. Ακούγεται πολλά υποσχόμενο, ωστόσο τσαλαβουτάνε σε συνωστισμένο πεδίο,» λέει ο Etzioni.

Πηγή: www.pathfinder.gr

Χιδερίδης Μ. Τάσος
Author: Χιδερίδης Μ. ΤάσοςWebsite: http://www.about.me/chideridis
Administrator

Joomla SEF URLs by Artio