summaryrefslogtreecommitdiff
path: root/man/hu/hunspell.1
blob: 0d0b6c8bda35434679991965f6ada1f25008277e (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
.hla hu
.TH hunspell 1 "2008. április 11."
.LO 1
.SH NÉV
hunspell \- unicode-os helyesírás\-ellenőrző, szótövező és morfológiai elemző program
.SH ÁTTEKINTÉS
hunspell [\-1aDGHhLlmnstvw] [\-\-check\-url] [\-d szótár[,...]] [\-p sajátszótár] [állomány(ok)]
.SH LEÍRÁS
A
.B hunspell
felismeri és javítja az elütéseket és típushibákat
egyszerű szöveges, (La)TeX, HTML és groff (kézikönyv oldal) állományokban.
.PP
Ha nem adunk meg állománynév-paramétert, a Hunspell az Ispell
csőfelületéhez hasonlóan működik: a bemenet sorait szavakra bontja,
és *, +, vagy - jellel kezdődő kimeneti sorral jelzi, ha egy szó jó,
és # vagy & jellel, ha rossz. A csőfelület parancsait viszont az
Ispellhez hasonlóan csak a
.I \-a
kapcsoló megadásával értelmezi.
.PP
Állománynév paraméter esetén elindul egy az Ispelléhez hasonló interaktív felület.
.SH KAPCSOLÓK
.TP
.B \-1
Speciális formátum: a bemeneti állomány tabulátorjelet tartalmazó soraiból csak az
első tabulátorjel előtti karaktersorozatot vizsgálja meg.
.TP
.B \-a
Ispellhez csőfelület. A
.I !,
.I +,
.I \-,
.I \@,
.I #,
vagy
.I ^
jellel kezdődő sorok a csőfelület parancsai, jelentésüket
az Ispell kézikönyvoldal részletezi. A \-a kapcsoló
hatására a kimenetben a jó szavakat csak csillaggal jelzi
a Hunspell. Ez nagyobb kompatibilitást biztosít az Ispellt használó programok
némelyikével (például a LyX-szel). Ekkor nem kell
megadnunk a \-a kapcsolót, mivel az Ispellt
használó programok automatikusan ezzel a kapcsolóval indítják
el az Ispell nevében futó Hunspellt is.
.TP
.B \-d " szótár[,szótár2,...]"
Beállítja a helyesírási szótárakat a
kiterjesztés nélküli szótárnevek, útvonalak
megadásával.

Például a
.PP
hunspell \-d hu_HU,hu_geo,hu_med,de_DE,de_med
.PP
a magyar alapszótárat és kiegészítő szótárait,
valamint német alapszótárat és annak egy kiegészítő
szótárát tölti be. Az alapszótárak egy aff és egy dic
kiterjesztésű állományból állnak, a kiegészítő szótárak
csak dic állományból. A kiegészítő szótárak
nevére vonatkozóan nincs szabály (csak a dic kiterjesztés),
a szótárnevek sorrendje határozza meg, hogy melyik alapszótárhoz
töltődnek be a kiegészítő szótárak (ami pedig meghatározza
a javaslattevést). Az első szótár mindig alapszótár.
.PP
Az alapértelmezett szótár a környezet nyelvi beállításától függ
az Unix rendszereken. Locale hiányában a
.BR /usr/share/hunspell/default
az alapértelmezett szótár. 
.PP
A megadott útvonal lehet abszolút és relatív is. Relatív
útvonal esetén először az aktuális, majd a
.BR /usr/share/hunspell
és még több más könyvtárban keresi a szótárt a program. L. \-D és a
.BR PÉLDÁK.
.TP
.B \-D
A keresési útvonalak, az elérhető és betöltött szótárak útvonalának
kijelzése.
.TP
.B \-G
A \-l, \-w, és \-L kapcsolókat kiegészítő kapcsoló. A standard bemenetről
érkező hibás szavak, illetve
sorok megjelenítése helyett a jó szavak és a hibátlan sorok megjelenítését
kérhetjük vele. Ha mást nem adunk meg, a \-l kapcsoló hatásának megfelelően
működik, csak a rossz helyett a jó szavakat írja a standard kimenetre.
.TP
.B \-h, \-\-help
A beépített leírás megjelenítése.
.TP
.B \-H
HTML bemeneti állományformátum beállítása. Ha az állomány
nevének .html, .htm, vagy .xml a kiterjesztése, ez automatikusan bekövetkezik.
.TP
.B \-l
Kiírja a hibás szavakat a standard bemenetről érkező állományból.
Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló
megfordítja a Hunspell működését: csak a jó szavak kerülnek kiírásra.
.TP
.B \-L
Csak a hibás szavakat tartalmazó sorokat írja ki a standard bemenetről érkező állományból.
Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló
megfordítja a működését: csak azok a sorok kerülnek kiírásra, amelyek egy
hibás szót sem tartalmaznak.
.TP
.B \-m
Elemző üzemmód: a bemeneti szövegszavak morfológia elemzése, illetve a szótári
morfológiai leírás hiányában a toldalékolt szavak kapcsolóinak
kijelzése (szótárfejlesztőknek).
.TP
.B \-n
Nroff/troff bemeneti állományformátum beállítása, elsősorban a 
kézikönyvlapok ellenőrzésére.
.TP
.B \-p " saját_szótár"
A felhasználó saját szótárának beállítására szolgál.

Az alapértelmezett saját szótár a
.BR $HOME/.hunspell_default
állomány. Ha szótárat is megadunk a
.I \-d
kapcsolóval, vagy a
.I DICTIONARY
környezeti változóval, a saját szótár a
.BR $HOME/.hunspell_szótárnév
lesz. Ha a saját szótár nem létezik, létrehozza.

Ha az aktuális könyvtárban is van egy ugyanilyen nevű
állomány, akkor annak tartalma is beolvasásra kerül,
mint saját szótár, és az újonnan felvett szavak is
ide kerülnek.

A
.I \-p ,
vagy a
.I WORDLIST
környezeti változó megadásával új saját szótárat
jelölünk ki. A saját szótárat az aktuális könyvtárban,
és a saját könyvtár gyökerében ($HOME) keresi a
Hunspell. Ha nem található, akkor az újonnan felvett
szavak mentésénél létrehozza a saját könyvtár gyökerében.
.TP
.B \-s
Tövező üzemmód: a bemenő szövegszavak tövezése (a szótártól függő
pontossággal).
.TP
.B \-t
LaTeX bemeneti állományformátum beállítása. Ha az állomány nevének .tex
a kiterjesztése, ez automatikusan bekövetkezik.
.TP
.B \-u
Tipikus hibák kijelzése az állományból, cserejavaslattal.
.TP
.B \-u2
Tipikus hibák és javításuk kijelzése módosítható, és a
sed programmal végrehajtatható formában.
Irányítsuk a Hunspell kimenetét egy állományba.
Törüljük azokat a sorokat az elmentett állományból,
amelyek sed paranccsal megadott javítását nem szeretnénk.
Mentsük el az állományt, és
a \fIsed -f javítás eredeti_állomány >javított_állomány\fR
paranccsal javíthatjuk az állományt gyorsan
és egyszerűen. (A sok hibát tartalmazó állományok
javítását gyorsítja meg ez a lehetőség.)
.TP
.B \-U
Ha az -u kapcsolóval kapott javaslatokat mind el szeretnénk fogadni,
akkor az \-U kapcsolóval a Hunspell automatikusan
végrehajtja a cseréket, és a módosított állományt
a szabványos kimenetre küldi. Példa a javításra:
\fIhunspell -U eredeti_állomány >javított_állomány\fR.
A hibakimeneten megjelennek a javítások is még egyszer, a
-\u kapcsolóhoz hasonló módon.
.TP
.B \-v
Verziószám.
.TP
.B \-vv
Verziószám (Ispell kompatibilitás miatt).
.TP
.B \-w
Csak a hibás szavakat írja ki a standard bemenetről érkező, soronként
egy szót tartalmazó állományból. A sorok nincsenek szavakra
bontva. A sorok szavakra bontása, és csak a hibás szavak kiírása a \-w kapcsolóval
érhető el. A \-G kapcsoló megfordítja a Hunspell működését: csak a jó szavak kerülnek
kiírásra.
.SH INTERAKTÍV FELÜLET
A felület legfelső sorában a hibás szóalakot, és az éppen vizsgált
állomány nevét látjuk. Amennyiben egy szóalak szótári tiltás
miatt nem kerül elfogadásra, a bal felső sarokban a TILTOTT!
(FORBIDDEN!) üzenet is megjelenik. Ez az üzenet arra utal, hogy nem
hiányos szókincs, hanem szándékos tiltás miatt nem került a szó
elfogadásra. Az első sor alatt az állomány hibás szót tartalmazó sorát, és
szövegkörnyezetét láthatjuk, majd ezt követik a javaslatok, ha vannak.
.PP
A használható billentyűkombinációk:
.TP
.B Szóköz
Továbblépés javítás nélkül a következő hibás szóra.
.TP
.B Számok
A megfelelő javaslat kiválasztása.
.TP
.B c
Csere. A hibás szó cseréje a megadott szóra, vagy szavakra.
Az Escape billentyű kétszeri lenyomásával megszakíthatjuk a
a cserét.
.TP
.B j
A szó elfogadása a program futásának befejeződéséig.
.TP
.B f
A szó felvétele a saját szótárba.
.TP
.B k
A szó kisbetűsként való felvétele a saját szótárba.
.TP
.B t
Ragozott tőszó felvétele. A ragozás a másodikként
megadott, mintául szolgáló szó alapján történik.
Ha ez a szó nincs felvéve a szótárba, a tőszófelvételt
elölről kell kezdeni.

Példa: gyakran hiányoznak az idegen és a
mozaikszavak. Vegyük fel a hiányzó OTP szót
a tv köznévi mozaikszó toldalékaival!
Lenyomjuk a t billentyűt, beírjuk, hogy OTP,
leütjük az új sor billentyűt, beírjuk, hogy tv, és ismét új sor. A tv szó
ugyanis már szerepel a szótárban, és ragozása
mondja meg a programnak, hogy az OTP szót
milyen toldalékokkal szeretnénk látni, pl.
OTP\-hez, OTP\-met stb. a tv\-hez, tv\-met mintájára.
A \-val/\-vel, \-vá/\-vé toldalékokat
a kötőjellel kapcsolt toldalékú szavak
esetében külön kell felvenni, de még így is sokkal
kényelmesebb a speciális tőfelvétel, mint minden
(akár több száz) toldalékos alakot külön\-külön
felvenni.

Egy kis segítség a minta kiválasztásához:
első menetben a hangrend számít. Pl. mozaikszavaknál a
mély hangrendű új szavak felvételénél használhatjuk
a \fIMÁV\fR szót példaként, ajakréses magas hangrendnél
pedig az említett \fItv\fR\-t. Ajakkerekítéses magas hangrend
esetében a \fIHÖK\fR szót használhatjuk (amíg át nem
lesz javítva a helyes hök\-re). Ha a hiányzó
szó nem mozaikszó, hanem például tulajdonnév, 
a \fIPál\fR, \fIPéter\fR, \fIÖrs\fR szavakat adhatjuk
meg példának a hangrendtől függően. Ha meg
egyszerű köznévről van szó, akkor használjuk az
\fIok\fR, \fIék\fR, \fIük\fR szavakat.
Igéknél \fIáll\fR, \fIvél\fR, \fIül\fR,
ikes igéknél \fIázik\fR, \fIvérzik\fR, \fInőzik\fR
lehet a példa (remélhetőleg a következő
változatokban egyszerűsödik ez a tőfelvétel).

Az Escape billentyű kétszeri lenyomásával megszakíthatjuk ezt
a műveletet.

Az itt felvett szavak automatikusan a saját
szótárba kerülnek. Ha ezt innen törölni
szeretnénk, a programból kilépve
a saját szótár kézi átszerkesztésével tehetjük meg.

.TP
.B m
Kilépés a változtatások mentése nélkül. A program
változtatás megléte esetén megerősítést kér.
.TP
.B v
Az állomány ellenőrzésének megszakítása a változtatások
mentésével. Ha van következő állomány, akkor
a program annak ellenőrzését kezdi el.
.TP
.B ?
Segítség. Hasonló rövid leírás megjelenítése a
billentyűparancsokról.
.SH CSŐFELÜLET
A \fIHunspell \fR soronként dolgozza fel az
állományokat, a helyes szavakat \fI*\fR (tőszó), \fI\-\fR
(összetett szó), vagy
.I +
(ragozott szó) karakterrel jelöli, a helyteleneket
.I #
(nincs javaslat) , vagy
.I &
(van javaslat) karakterrel. A + jelet a kimenetben követi még a szótő.
A # jel után a hibás szó, és kezdőpozíciója van feltüntetve.
A & jelet követi a hibás szó; a javaslatok száma; a hibás szó
kezdőpozíciója; majd kettőspont után a javaslatok, vesszővel elválasztva:
.PP
.RS
.nf
macska
*
macskabajusz
-
macskák
+ macska
mcsk
# mcsk 0
macka
& macka 7 0: macska, maca, racka, packa, vacka, marka, mackó
.fi
.RS
.SH PÉLDÁK
.TP
.B hunspell \-d en_US english.html
Az amerikai angol helyesírási szótár kiválasztása (aktuális, vagy a
.BR /usr/share/hunspell
könyvtárból.
.TP
.B hunspell \-d /opt/OpenOffice.org1.0.1/share/dict/ooo/de_DE
A német helyesírási szótár kiválasztása a megadott abszolút
útvonalról, a standard bemenet feldolgozásával.
.TP
.B hunspell *.html
Az aktuális könyvtárban található összes HTML állomány
interaktív ellenőrzése.
.TP
.B hunspell -l szöveg.html
A megadott állomány hibás szavainak kiírása.
.SH KÖRNYEZET
.TP
.B DICTIONARY
A szótár helyének megadására szolgál. Szerepe megegyezik a
.I \-d
kapcsolóval.
.TP
.B DICPATH
A szótárkeresési útvonalat tartalmazó változó.
.TP
.B WORDLIST
A saját szótár helyének megadására szolgál. Szerepe megegyezik a
.I \-p
kapcsolóval.
.SH ÁLLOMÁNYOK
.BI /usr/share/default.aff
Az alapértelmezett ragozási táblázat. Lásd hunspell(4).
.PP
.BI /usr/share/default.dic
Az alapértelmezett szótár az előző ragozási táblázathoz.
Lásd hunspell(4).
.BI $HOME/.hunspell_default
Az alapértelmezett saját szótár. Az állományt létrehozza
a Hunspell, ha nem létezik. Lásd ispell(1).
.SH LÁSD MÉG
.B hunspell (4),
.B hunstem (1),
.B makedb (1),
.B lookdb (1),
.B ispell (1),
.B ispell (4),
Magyar Ispell dokumentáció.
.SH ELŐNYÖK
A program a következő előnyöket nyújtja a hasonló célokat szolgáló \fIIspell\fR\-lel szemben:
.IP \-
Képzők átfogó ismerete. (Több tízezer helyes szóalak elfogadását tette
lehetővé a tesztelésre használt 4 millió szavas gyakorisági szótárban.)
.IP \-
Homonimák kezelése (nincsenek például olyan alakok elfogadva, mint megvárban).
.IP \-
Helyes javaslatok a több karakter változásával járó tipikus hibákra
(j/ly, íj/ijj, nyj/nny és még több tucatnyi tévesztés megvizsgálásával).
Az \fIIspell\fR csak két karakter felcserélése; vagy egy karakter hiánya,
cseréje, illetve felesleges jelenléte esetén ad helyes javaslatot.
.IP \-
Az összes helyes összetett szónak látszó, de tipikus hibával előálló alak tiltása (karvaj, színtű, súlytó stb.)
.IP \-
Javaslatok valószínűségi sorrendben  jelennek meg (tipikus hibák, i/í, o/ó, u/ú tévesztések stb.).
.IP \-
Összetett szavak esetén  6–3\-as szabály alkalmazása (helyesírás\-ellenőrző, gépkocsi\-összeszerelés).
.IP \-
Mozgószabály alkalmazása (kiviteli engedély, kiviteliengedély\-kérés).
.IP \-
A magyar nyelv egyéb összetételi szabályainak alkalmazása (például hatlövetű, tizenkét lövetű, kéthavi, két hónapos, másodmagával).
.IP \-
Leg-, legesleg- és -bb confixum helyes kezelése (nincs pl. legédes, csak legédesebb).
.IP \-
Ragozható tőszófelvétel. Megkönnyíti egy új szó ragozott változatainak ellenőrzését, feleslegessé téve ezek külön\-külön történő felvételét a saját szótárba.
.IP \-
Javaslatok mássalhangzó\-triplázások (sakkkör, baletttáncos, dzsesszszak) esetén.
(Ispell helyesnek fogadja el ezeket.)
.IP \-
Javaslatok szótagduplázások (oktatatás, igenenevet) esetén.
.IP \-
Javaslatok ékezet nélküli szövegre (tukorfurogep\->tükörfúrógép).
.IP \-
Kötőjeles szavak kezelése (unos\-untalan).
.IP \-
Toldalékolt számok (1\-jén, 11\-én, 5.\-et) kezelése.
.IP \-
°, %, és § jelek (%\-kal) toldalékolt alakjainak kezelése.
.IP \-
Mozaikszavak (MÁV\-osokat) kezelése.
.IP \-
Y-ra végződő szavak (boyjal, pennyvel) kezelése.
.IP \-
Idegen ejtésű szótagra végződő szavak (Anonymusszal, Voltaire\-nek) kezelése.
.IP \-
Két szóból álló földrajzi nevek (San Franciscó\-i) kezelése.
.IP \-
Hibás alakok tiltása (Babitssal, tanit, alkotóművész stb.)
.IP \-
Tiltások jelzése a felhasználói felületen.
.IP \-
Egyéb (például az Ispell ragozott utószó esetében bármilyen szóösszetételt elfogad: macskatekerem, kutyakavarom, ezt a Hunspell nem teszi meg).
.IP \-
Magyar nyelvű (illetve 
.B locale (7)
függő) felület.
.IP \-
Hordozható szöveges szótárállományok, szemben az Ispell platform, és bináris Ispell fordítástól függően (nem) kezelhető adatállományaival.

.SH SZERZŐ
A Hunspell az OpenOffice.org MySpell függvénykönyvtárán továbbfejlesztése.
A MySpell affixumtömörítésének mintája az International Ispell program volt.
.PP
A mintaként szolgáló International Ispell szerzője Geoff Kuenning,
sok más elődje munkájára támaszkodva (l. ispell(1)).
.PP
A Myspellt Kevin Hendricks készítette a legjelentősebb
nyílt forráskódú irodai csomaghoz, az OpenOffice.org-hoz 2001\-2002\-ben
(l. http://hu.openoffice.org).
.PP
A Hunspell programkönyvtárat és parancssori programot
Németh László <nemeth@openoffice PONT org> készítette 2002\-2008\-ban.