]> git.wh0rd.org - tt-rss.git/blame - plugins/af_sort_bayes/lib/README.txt
add placeholder stuff for af_sort_bayes
[tt-rss.git] / plugins / af_sort_bayes / lib / README.txt
CommitLineData
853cc128
AD
1/*
2 ***** BEGIN LICENSE BLOCK *****
3 This file is part of PHP Naive Bayesian Filter.
4
5 The Initial Developer of the Original Code is
6 Loic d'Anterroches [loic xhtml.net].
7 Portions created by the Initial Developer are Copyright (C) 2003
8 the Initial Developer. All Rights Reserved.
9
10 PHP Naive Bayesian Filter is free software; you can redistribute it
11 and/or modify it under the terms of the GNU General Public License as
12 published by the Free Software Foundation; either version 2 of
13 the License, or (at your option) any later version.
14
15 PHP Naive Bayesian Filter is distributed in the hope that it will
16 be useful, but WITHOUT ANY WARRANTY; without even the implied
17 warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
18 See the GNU General Public License for more details.
19
20 You should have received a copy of the GNU General Public License
21 along with Foobar; if not, write to the Free Software
22 Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
23
24 ***** END LICENSE BLOCK *****
25*/
26
27
28** Presentation **
29
30Voici une implementation generale d'un filtre reposant sur le theoreme de Bayes.
31L'application la plus connue est le filtre anti-spam. Vous pouvez aussi
32l'utiliser pour faire de la classification automatique de documents.
33
34Ce programme se base sur la version simplifiee du theoreme de Bayes comme
35decrite par Ken Williams, ken@mathforum.org sur la page
36http://mathforum.org/~ken/bayes/bayes.html au 31/10/2003.
37
38Le systeme permet de maniere generale de faire la classification de documents
39textes dans differentes categories. Si vous voulez l'utiliser pour une
40classification de vos messages entre spam et non-spam, alors il vous faudra 2
41categories, une "spam" et une "nonspam".
42
43J'ai cree ce script car c'est une sujet a la mode en ce moment. Particulierement
44pour filtrer les commentaires et les trackbacks dans les blogs. Le systeme
45propose ici permet d'avoir plus que deux categories spam et non spam. Cela permet
46donc theoriquement de l'utiliser pour la classification dans de multiples
47categories.
48
49Un petit script 'index.php' vous permet de tester le systeme, ensuite vous
50pouvez inclure la classe dans vos scripts. Les fichiers class.naivebayesian.php
51et class.naivebayesianstorage.php peuvent aussi etre utilises avec la licence
52GNU Lesser General Public License Version 2.1 ou ulterieure.
53
54
55** Fonctionnalites **
56
57- Une classe avec la logique de base, une autre qui est l'interface de stockage.
58