Zajímavé texty jsou většinou v cizích jazycích. My je ale potřebujeme v češtině a ve Wordu, abychom v nich mohli šťourat. Musíme to vyprat! Ano je řešení a dost primitivní Scan textu do Word textu. Texty jsou v knize (naskenovat), ale pak se počítači jeví jako obrázek a je konec. Texty jsou ve formátu .pdf, tam se vyberou CTRL C a šup do Wordu CTRL V. Nojo, ale cenné texty jsou chráněné a nejdou vybrat, takže nic, jeví se počítači jako obrázek. Summa sumárum potřebujeme vydolovat texty z obrázků. Říká se tomu Optical Character Recognition. Až budeme mít ten text ve Wordu (cizojazyčný) strčíme ho do překladače Google a je hotovo!!!
Úkol je obtížný. Mám před sebou 60 stran hnusného šedivého scanu v angličtině, odborné termíny, plno obrázků a grafiky. Chci to česky! Pomáháme si nástroji OCR (Optical Character Recognition).
Nástroj Onlineocr
Funguje on-line, netřeba nic instalovat. www.onlineocr.net
Dokument dáme do Skeneru. Malování – Soubor – Skener nebo fotoaparát – Černobílý obrázek, nebo text. Soubor uložit jako, např golflake02.jpg. Stejně poslouží fotka z mobilu, či kompaktu.
Otevři software www.onlineocr.net
Vyberte soubor (Select file – vyberte jazyk toho obrázku ENGLISH (umí i CZECH) – kam? Microsoft Word – Convert. Hotovo.
Je to zadarmo. Výběr soubor max 15 MB; max 15 obrázků za hodinu. Bez instalace.
Text s mizernou angličtinou opravíme podle originálu, vybereme a přendáme do Google Překladače. V Překladači český překlad vybereme a převedeme do Wordu. Tam vše upravíme.
Obrázky musíme v originále vyříznout a sem vložit, anebo překreslit.
***
Potřebujeme software OCR. Ten už kupodivu v počítači je Microsoft Office One Note. Dá se použít i drive.google.com, ale ten je trochu složitější. Jdeme do toho:
- Počítač vlevo dole v rohu Všechny aplikace – najdi One Note – pravá myš – Další – Připnout na hlavní panel (dole lišta).
2. Klepněte na ikonu OneNote. Otevře se OneNote, kurzor bliká (čeká co bude).
3. OneNote vpravo nahoře v rohu zmenšete na lištu znaménkem malé minus. Otevřeme naskenovanou stránku tam, kde chceme brát a necháme jí běžet.
4. Klepneme dole na ikonu OneNote a tam dáme Menu: Vložení – Výřez obrazovky. Objeví se ten naskenovaný text a obrazovka se zamlží (příprava na výřez). Kurzor se změnil na křížek. Křížkem vybereme text a ten výběr sám skočí do OneNote. Nabízí dokonce, že to nabere rovnou ze scanneru, záleží na tom jakou máte kombinovanou tiskárnu.
5. Pravou myší do textu – Kopírovat text z obrázku. Text se sám vybere. Dáme kurzor doprava a CTRL V. Hotový textový (ne obrázek) text je vpravo!!! Kupodivu umí načíst i český text.
6. Ten hotový text nabereme do myši CTRL C a strčíme ho do Wordu. Menu: Soubor – Nový. Menu: Soubor – Schránka – Vložit – Vložit jinak – Neformátovaný text. Je to pořád anglicky. Mohlo by se to upravit.
7. Text nabereme do myši CTRL C a strčíme ho do Google Překladač Ctrl V. Tam pak hotový překlad (vpravo už je česky) nabereme do myši CTRLC a dáme zpět do Wordu CTRLV. Místy je to paskvil. Ztraceno v překladu.
Hotovo!
Kvalita záleží na kvalitě originálu, pokud je pěkně černobílý, velké písmo Arial či Times, výsledek je lepší. Např. přetah z pdf Guitar Pro je dokonalý:
A co obrázky? Ty vyřízneme nástrojem který v počítači už je Výstřižky (ikona nůžky). Uložíme je jako obrázky.
Na třetí pokus už to půjde samo.
****