Jump to content

Пресловљавање


overkind

Recommended Posts

Елем, да покушам да питам РУР програмере, ако може лаику уопште да се објасни. Шта је суштина пресловљавања са латинице на ћирилицу? Млатим се са неким екњигама и издањима на латиници које пребацујем у ћирилицу. Ово може да се ради у Ворду, тако и радим сада, али сам нашао неке скритпе у Пајтону које пресловљавају било који текст, односно текстулане фајлове. Радозналости ради, пробао сам да читам код да сконтам шта заиста ради, и да можда напишем неки свој код за то и избацим Ворд из процеса. Скрипте које имам су писане "за Линукс" и не раде под Вином без да се не знам шта промени.
Може ли некоме ко не зна о програмирању да се објасни како се ради пресловљавање испод хаубе? Шта треба да прочитам да бих научио, ако се уопште исплати да се бакћем с тим?

...Од рођења спремна стоји, мене чека моја рака,
Да однесе све што имам у дубину у дубоку.

 

Link to comment
Share on other sites

Najgluplja verzija algoritma bi bila:

Petlja: Za svako slovo u dokumentu

Ako je slovo A: Zameni to slovo u ćirilično A (nije isti kôd u Unicode tabeli)
Ako je slovo B: Zameni to slovo u ćirilično Б (nije isti kôd u Unicode tabeli)
(i tako redom sva mala i velika latinična slova)
Ako nije ništa od toga, ne diraj slovo

Kraj petlje

Link to comment
Share on other sites

имаш проблем код дифтонга, тојест изузетке, као код инЈекције, конЈуктуре, као и код д+ј=ђ, ако је неко тако писао на латиници (подјармити), а још је и ијекавица (дјеца,...).

MORTALIS HOMO AURA PER KHARONE SERVA

Style over subsistence

Crown of Light. Keeper of The Yoda Chamber. I&I, Righteous Army of One.

Link to comment
Share on other sites

U stvari propustio sam momenat gde bi hteo to da radiš u batch varijanti, bez Worda. Python skripte bi trebalo da rade na Windowsu bez izmena (osim ako su loše kodirane pa se oslanjaju na specifičnosti OS-a), probaj da instaliraš Python na Windowsu pa pusti.

Isto i ovo što Debely kaže, ako nemaš bazu reči i izuzetaka pravila, onda će biti prevelika zezancija da pišeš od nule.

Link to comment
Share on other sites

Napraviš spisak izuzetaka u kojima ne vrši promenu. Naravno, ni to ne bi bilo savršeno jer bi u slučaju slovne greške bila izvršena promena.

Je l' uspeo neko onaj word plugin da natera da radi?

Edit: nisam video da je vudly napisao za izuzetke, skuzi, nisam rifreskare topik.

Don't think of understanding as a 'mental process' at all. Rather ask yourself: in what kind of case, under what circumstances do we say "now i can go on".

fUS165

kWcQcwQpf9Dedwp8ic

Link to comment
Share on other sites

Хвала, хвлала.

Ајде, пробаћу да покренем па се јављам.

На Ворду 2013 код мене ради ово:

 https://alberoart.com/translitgt-add-in/ 

Подразумевам да је тескт грамитички коректно написан. Улазни фајл је летинични скен кнјиге или екњига на латиници. Ако улаз није ОК онда морам да читам књигу у току обраде и пеглам све грешке - ово је мало много. Тешко да се исплати.

Лик који је написао скрипту има и неку базу изузетака, типа римских бројева, али мислим да не поркива "лошу" ијекавицу, дифтонге и шта већ. Требало би да након пресловљавања тражи те изузетке и враћа их на латинуцу.

Ако сам сконтао суштина је у тражењу и мењању Unicode вредности?

...Од рођења спремна стоји, мене чека моја рака,
Да однесе све што имам у дубину у дубоку.

 

Link to comment
Share on other sites

Jeste ako algoritam radi slovo po slovo, ali da bi spisak izuzetaka imao smisla, moraš da napraviš prepoznavanje reči, npr ako naiđeš na slovo a pre toga je bio razmak, tab, novi red ili interpunkcija, to je početak reči; u obrnutom slučaju je kraj; pa onda ne obrađuješ dokument slovo po slovo nego reč po reč, gde stalno proveravaš da li reč postoji u bazi i kako je u tom slučaju obrađuješ. Uzevši u obzir i uvek zanimljive rodove, padeže, priloške odredbe itd, tu se priča dodatno komplikuje (pored prepoznavanja reči, moraš da radiš i nekakav search-replace delova reči koji se ne menjaju, ili da čuvaš svaku reč u svim mogućim oblicima pa da radiš pretragu u bazi).

TL;DR Možda prosto da radiš copy-paste teksta u preslovljavanje.com, mislim da je to najkompletniji "endžin" koji sam probao.

Link to comment
Share on other sites

Знам за сајт, али идеја ми је да пресловљавам целе књиге, и да не будем везан за Ворд, или неки сајт. Тешко да могу да бацим целу књигу тамо.

Све ми се чини да пресловљавање није тривијална ствар :)

 

 https://github.com/strn/epub2cir 

Каже да је uniconv.py главна функција.

Edited by overkind
...Од рођења спремна стоји, мене чека моја рака,
Да однесе све што имам у дубину у дубоку.

 

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...