Vítejte na Elektro Bastlírn?
Nuke - Elektro Bastlirna
  Vytvořit účet Hlavní · Fórum · DDump · Profil · Zprávy · Hledat na fóru · Příspěvky na provoz EB

Vlákno na téma KORONAVIRUS - nutná registrace


Nuke - Elektro Bastlirna: Diskuzní fórum

 FAQFAQ   HledatHledat   Uživatelské skupinyUživatelské skupiny   ProfilProfil   Soukromé zprávySoukromé zprávy   PřihlášeníPřihlášení 

Ako oskenovať knihu

 
Přidat nové téma   Zaslat odpověď       Obsah fóra Diskuzní fórum Elektro Bastlírny -> Poradna
Zobrazit předchozí téma :: Zobrazit následující téma  
Autor Zpráva
SMITH



Založen: Jun 07, 2004
Příspěvky: 1273
Bydliště: Púchov , SLOVENSKO

PříspěvekZaslal: út červen 24 2008, 23:19    Předmět: Ako oskenovať knihu Citovat

Konečne som sa dopracoval k scaneru a chcel by som zoskenovať zopár kních . Po zapár pokusoch som neprišiel na vhodný postup, preto sa pýtam ako na to ?

Chcel by som aby výsledok vyzeral profesionálne a bol v PDF.
Robí sa to cez OCR nejakým špecial postupom ?

_________________
Smile Nikdy neříkejte, že něco nejde, protože vždy se najde blbec, který neví, že to nejde, a udělá to ! Smile
Úspěch je špatný učitel. Kvůli němu si chytří lidé myslí, že nemohou prohrát. (Bill Gates)
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
Crifodo



Založen: Oct 11, 2005
Příspěvky: 15005

PříspěvekZaslal: st červen 25 2008, 5:34    Předmět: Citovat

Když ses konečně dopracoval ke scanneru, tak asi brzo zjistíš, že přefocení digitálem poskytne při kvalitním světle prakticky stejně dobrý výsledek a je 10x rychlejší. Focení navíc líp vyřeší problémy s vazbou tlustších knih, kdy skener dělá optickou deformaci, šedivý pruh u hřbetu atd.
OCR je určitá pomůcka, ale neřeší: jiné než dobře OCR-čitelné typy písma, linky, nadpisy, sazbu do bloků, obtékání ilustrací textem, grafiku v textu, záhlaví a patičky, sazbu jiným než černým písmem (bez zdlouhavé ruční korekce)... obyčejně taky kvalitní OCR nemá češtinu/slovenčinu, to je jen za citelný příplatek k profi verzi. Takže s OCR leda tak jednosloupcovou hladkou sazbu bez obrázků, jako bývaly třeba detektivky nebo střídmá beletrie. Na odborné publikace s vzorci, grafy to už moc není, časově vychází pak líp tu knihu buď kopírovat jako bitmapu nebo přepsat a přesázet. OCR ti stejně poskytne plain text který musíš znova formátovat do bloků s odstavci, nadpisy atd.
Každopádně je to šílená piplačka, když to má vypadat aspoň jako originál.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
vicious



Založen: Aug 10, 2007
Příspěvky: 661
Bydliště: 3 km od Humenného

PříspěvekZaslal: st červen 25 2008, 13:27    Předmět: Citovat

Pdf sa dá vyrobiť v programe OpenOffice
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
souba



Založen: Jan 21, 2005
Příspěvky: 706

PříspěvekZaslal: st červen 25 2008, 14:07    Předmět: Citovat

Přesně jak píše Crifodo .
Foťák je na knihy lepší než skener.
Práce ale hrozná.Pokud chceš aby to vypadalo solidně.

Trochu trpělivosti neuškodí .
Pokud nejde o život není kam spěchat.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
Devo70



Založen: Dec 28, 2007
Příspěvky: 1290
Bydliště: Poprad

PříspěvekZaslal: st červen 25 2008, 14:21    Předmět: Citovat

Najjednoduchšie je oskenovať stránky ako obrázky a následne ich vložiť do PDF formátu. Pri OCR treba všetko pracne kontrolovať, aj tak tam budú stále chyby. Confused
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
kevin_mitnick



Založen: May 20, 2007
Příspěvky: 1778

PříspěvekZaslal: st červen 25 2008, 15:21    Předmět: Citovat

Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
Zirafka



Založen: Aug 20, 2006
Příspěvky: 819

PříspěvekZaslal: st červen 25 2008, 19:10    Předmět: Citovat

Dobrý OCR program si poradí i s obrázky, tabulkami, sazbou a dalšími věcmi. Potíž je v ceně, ale pokud těch knih je více, asi by to stálo za hřích.

Jinak foťák ti tedy moc nedoporučuji, a nebo jedině tak, že budeš fotit z veliké dáááááááááááááálky, protože jinak z toho budeš mít soudky (tedy obrázek bude deformován do tvaru soudku).

Nejlepší by na to měl být CCD skener, i když oni dneska všechny jsou CCD, nebo se snad ještě prodávají CIS jako má doma já? Very Happy Důležité však je, aby uměl zaostřovat a také měl dobrou lampu, čili to chce skener trošku vyšší třídy než jsou ty nejlacinější na trhu. Můj Mustek stál před asi deseti lety skoro 5kKč, ale šlape do dneška. Na knihy však není, je to CISka a ne CCDčko.

Vkládat do PDFka celé stránky jako obrázek je smrtelný hřích a měl by se trestat vhozením do blízké řeky Twisted Evil
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
Artaban001



Založen: Apr 01, 2004
Příspěvky: 9768
Bydliště: Pendrov

PříspěvekZaslal: st červen 25 2008, 20:06    Předmět: Citovat

Pár knih jsem naskenoval pomocí Finereaderu, nebo Photosopu.
Nepoužívám rozpoznávání OCR, neboť mi jde o zachování originality. Po OCR se musí text projít a opravit případné chyby. Po naskenování jen oříznu kraje, zostřím obraz a uložím jako PDF
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
Crifodo



Založen: Oct 11, 2005
Příspěvky: 15005

PříspěvekZaslal: čt červen 26 2008, 6:55    Předmět: Citovat

Variola: z jakého důvodu by měl digi foťák deformovat obrázky do soudků? Opticky korigované objektivy jsou známé asi tak 150 let. Nevšiml jsem si, že by během těch let všichni pracovníci v makrofotografii nebo i amatéři fotili desk-top z veliké dáááááááááááálky. Rolling Eyes
Nemělas na mysli čínský "objektiv" ze dvou plastových členů? Ten se ale neosazuje do foťáků. Dávají ho do hraček za 2000 nebo do mobilů.
Určité zkreslení (efekt rybí oko) můžou způsobovat i kvalitní objektivy širokoúhlé s kraťoučkou ohniskovou vzdáleností (pod 20 mm eq.), ale ty snad na makro nikdo nebere Wink Normální ohnisko odpovídající cca 60° zornému úhlu žádné vyklenutí neudělá, to si může každý ověřit. Spíš bude problém s přeostřením, čili předsádku na přírubu, nebo levnější foťáky které nemají objektiv opatřený závitem do režimu makro. Ověřeno že to jde i s miniaturními kompakty tl. 12mm s objektivem typu periskop, kdy žádný objektiv z těla aparátu nevystupuje a objektiv vidí ven jen okénkem v rovině přední stěny. Přesto fotí geometricky přesné makro jako víno.
Dobrý program i hodně dobrý program (Recognita, Character Eyes) má vždycky nějakou úspěšnost rozpoznávání, opravdu silně záleží na typu rozpoznávaného dokumentu. Vyzkoušel jsem jich v minulosti několik a nakonec jsem uznal, že zaplacení rychlé písařky je pro občasnou práci výhodnější než pořízení super dobrého programu s adaptivním učením (je problém, že obyčejně je demo jen ve verzi bez češtiny takže jak to dopadne v praxi je trochu hádanka). Ono totiž i tak zůstane spousta ruční práce než je výsledek použitelný, a sice kvalifikované typografie - sazbu je prakticky vždycky potřeba dělat znovu. Předtím je potřeba ručně vymezovat bloky textu, v případě nečerného písma dolaďovat úrovně č/b, opravy špatně rozpoznaných znaků, no a jestli chci převést original s grafy a tabulkami, tak tyto naskenovat v dobrém rozlišení a opět vysázet a obtékat mnou získaným textem. Nakonec z toho udělat pdf. Je to grandiozní práce, než vznikne z dobré knihy dobrá elektronická kniha...
Shrnuto: pro občasnou práci se kvalitní OCR nezaplatí, pro masovou produkci asi jo, ale něco budou stát autorské poplatky (nebo stažená (_._), kdy na mě autor podá žalobu), a navíc požadavky na vysokou kvalifikaci typografa, jestli to nemá být pro smích. U knih vydaných již v éře DTP se vyplatí získat elektronickou sazbu, beztak se knihy a časopisy nosí do tiskárny už častěji v pdf než v postscriptu...
"Publikování" dokumentů pdf kde je strana jen oskenovanou bitmapou fláknutou do souboru, nemá s e-knihou nebo časopisem nic společného, s tím souhlas Twisted Evil
Takhle někdo vydal stará AR, může si někdo zkusit v takové bitmapě vyhledat řetězec znaků Very Happy
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
rnbw



Založen: Mar 21, 2006
Příspěvky: 33934
Bydliště: Bratislava

PříspěvekZaslal: čt červen 26 2008, 7:38    Předmět: Citovat

CIS scannery sa stale robia - Canon LiDE. Maju jedinu vyhodu - daju sa napajat priamo z USB, netreba dalsi zdroj (takze sa da scanovat aj z notebooku niekde vonku).

Dobry OCR program = FineReader. Samozrejme je s tym potom kopa roboty, ak chces perfektny vysledok. Ma to jednu velmi podstatnu vyhodu - text mas ako text, takze sa v nom da vyhladavat.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
jandu



Založen: Feb 06, 2007
Příspěvky: 4509
Bydliště: vých.slovensko

PříspěvekZaslal: čt červen 26 2008, 15:09    Předmět: Citovat

FineReader 7.0 PE má aj češtinu, slovenčinu a "milion" iných jazykov. Ale na OCR treba veľké rozlíšenie a to je zase pri mnohostránkovej knihe "obrovský" súbor. /pri doporučenom minimálnom rozlíšení 300 dpi treba veľa opravovať/.

Všetko je o tom, nájsť vhodný kompromis - koľko stranová kniha, aké rozlíšenie, či OCR alebo bez - a ja osobne som za prefocovanie. Skúšal som prefotený dokument zrekognostikovať /OCR/- a šlo to pomerne dobre. A je pravda, pri fotení s makro /FUJI Finepix 5600/ je znatelná súdkovitosť, ale rozhodne nie je treba fotiť z veľkej dialky.

A nakoniec- PDF či JPG alebo bmp? Som za PDF, lepšie sa to potom číta, aj veľkosť súboru sa dá nastaviť. Iba pri listovaní vo viacstránkovom PDF súbore mi to "zaberá" mnoho pamäti a to spomaluje stránkovanie.

_________________
Elektronické súčiastky fungujú za pomoci dymu. Ak dym unikne, prestanú fungovať.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
Zirafka



Založen: Aug 20, 2006
Příspěvky: 819

PříspěvekZaslal: čt červen 26 2008, 15:09    Předmět: Citovat

Já používám program FineReader který jsem dostala ke svému skeneru a je docela dobrý. Není dokonalý, to ne, ale je to fakt dobrý pomocník. Jen je potřeba, aby snímek měl relativně vysoké rozlišení, ideální je 600DPI.

To šílené zkreslení není výmysl, ale zkušenost. Dělám občas přepisy z časopisů pro jeden web (pochopitelně legálně, redakce a provozovatel webu jsou dohodnuti). Většinou to skenuje, ale tuhle to poslal vyfocené. Totálně nepoužitelné. Nevím čím to fotit, ale fakt to nešlo. S dobrý foťákem by to neměl být problém, souhlasím. Ale ono je také otázka, kdo fotí. Většina lidí si myslí, že fotiti umí. Jak je to ve skutečnosti...

Já mám skener připojený přes ECP port Very Happy
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
jandu



Založen: Feb 06, 2007
Příspěvky: 4509
Bydliště: vých.slovensko

PříspěvekZaslal: čt červen 26 2008, 15:18    Předmět: Citovat

Mám skener Mustek 600GP. Je to starec, ale slúži poctivo. Iba je POMALÝ!. Na pár strán, na časopisy áno, tam čas nehraje úlohu, ale kniha cca 300 strán - to radšej fotím dvojstrany a prípadne ich v grafickom programe rozstrihám a zkonvertujem. Mám Adobe Acrobat 8 Prof., s ktorým sa dobre dá pracovať a zlučovať jednotlivé pdf dokumenty do jedného.
_________________
Elektronické súčiastky fungujú za pomoci dymu. Ak dym unikne, prestanú fungovať.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
Zobrazit příspěvky z předchozích:   
Přidat nové téma   Zaslat odpověď       Obsah fóra Diskuzní fórum Elektro Bastlírny -> Poradna Časy uváděny v GMT + 1 hodina
Strana 1 z 1

 
Přejdi na:  
Nemůžete odesílat nové téma do tohoto fóra.
Nemůžete odpovídat na témata v tomto fóru.
Nemůžete upravovat své příspěvky v tomto fóru.
Nemůžete mazat své příspěvky v tomto fóru.
Nemůžete hlasovat v tomto fóru.
Nemůžete připojovat soubory k příspěvkům
Můžete stahovat a prohlížet přiložené soubory

Powered by phpBB © 2001, 2005 phpBB Group
Forums ©
Nuke - Elektro Bastlirna

Informace na portálu Elektro bastlírny jsou prezentovány za účelem vzdělání čtenářů a rozšíření zájmu o elektroniku. Autoři článků na serveru neberou žádnou zodpovědnost za škody vzniklé těmito zapojeními. Rovněž neberou žádnou odpovědnost za případnou újmu na zdraví vzniklou úrazem elektrickým proudem. Autoři a správci těchto stránek nepřejímají záruku za správnost zveřejněných materiálů. Předkládané informace a zapojení jsou zveřejněny bez ohledu na případné patenty třetích osob. Nároky na odškodnění na základě změn, chyb nebo vynechání jsou zásadně vyloučeny. Všechny registrované nebo jiné obchodní známky zde použité jsou majetkem jejich vlastníků. Uvedením nejsou zpochybněna z toho vyplývající vlastnická práva. Použití konstrukcí v rozporu se zákonem je přísně zakázáno. Vzhledem k tomu, že původ předkládaných materiálů nelze žádným způsobem dohledat, nelze je použít pro komerční účely! Tento nekomerční server nemá z uvedených zapojení či konstrukcí žádný zisk. Nezodpovídáme za pravost předkládaných materiálů třetími osobami a jejich původ. V případě, že zjistíte porušení autorského práva či jiné nesrovnalosti, kontaktujte administrátory na diskuzním fóru EB.


PHP-Nuke Copyright © 2005 by Francisco Burzi. This is free software, and you may redistribute it under the GPL. PHP-Nuke comes with absolutely no warranty, for details, see the license.
Čas potřebný ke zpracování stránky 0.14 sekund