<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Alles Over EIM &#187; document management</title>
	<atom:link href="http://www.allesovereim.nl/tag/document-management/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.allesovereim.nl</link>
	<description>Enterprise Information Management</description>
	<lastBuildDate>Mon, 16 Jan 2012 14:40:58 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3</generator>
		<item>
		<title>Open Source scanning met Ephesoft en Alfresco</title>
		<link>http://www.allesovereim.nl/2011/01/open-source-scanning-met-ephesoft-en-alfresco/</link>
		<comments>http://www.allesovereim.nl/2011/01/open-source-scanning-met-ephesoft-en-alfresco/#comments</comments>
		<pubDate>Thu, 06 Jan 2011 09:07:43 +0000</pubDate>
		<dc:creator>tjarda.peelen</dc:creator>
				<category><![CDATA[Techniek]]></category>
		<category><![CDATA[alfresco]]></category>
		<category><![CDATA[document management]]></category>
		<category><![CDATA[Enterprise Content Management]]></category>
		<category><![CDATA[Ephesoft]]></category>
		<category><![CDATA[Mailroom Automation]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[open source]]></category>

		<guid isPermaLink="false">http://www.allesovereim.nl/?p=428</guid>
		<description><![CDATA[Een Document Management oplossing is goed in het beheren van &#8216;content&#8217;, procesondersteuning, het geven van inzich, overzicht en controle. Maar hoe komt de content het systeem binnen? Een kanaal kan &#8216;volledig digitaal&#8217; zijn, gevoed vanuit andere applicaties, email, office. Er is echter nog steeds een papieren stroom die ook in het DMS behoort te landen. Kortom, [...]]]></description>
			<content:encoded><![CDATA[<!-- Start Shareaholic LikeButtonSetTop Automatic --><!-- End Shareaholic LikeButtonSetTop Automatic --><p>Een Document Management oplossing is goed in het beheren van &#8216;content&#8217;, procesondersteuning, het geven van inzich, overzicht en controle. Maar hoe komt de content het systeem binnen? Een kanaal kan &#8216;volledig digitaal&#8217; zijn, gevoed vanuit andere applicaties, email, office. Er is echter nog steeds een papieren stroom die ook in het DMS behoort te landen. Kortom, er is behoefte op aansluiting met scanning.</p>
<p>Zou het niet fantastisch zijn als het proces van validatie en indexering, overdracht naar een DMS waar content kan worden beheerd tot het kan worden vernietigd, volledig web based en op een Open Source stack zou kunnen draaien? Dat kan! En <a href="http://ephesoft.com" target="_blank">Ephesoft</a> is de toegang!</p>
<p>Ephesoft is een  Open Source &#8216;Mailroom Automation&#8217; oplossing die precies dat doet. En meer.<br />
[[<a title="Open Source scanning with Ephesoft and Alfresco" href="http://tpeelen.wordpress.com/2010/12/23/alfresco-and-ephesoft-overview/" target="_blank">This article</a> exists in English as well.]]</p>
<p><span id="more-428"></span></p>
<p>Het bedrijf Ephesoft is opgestart en wordt geleid door voorheen Kofax medewerkers; er is dus behoorlijk wat domeinkennis aan boord. Het bedrijf heeft de capaciteit om dit product in hoog tempo uit te bouwen en op een niveau te brengen dat het voorziet in de behoefte (voor zover het dat nog niet doet dan). Net als bij Alfresco is het product van de grond af opnieuw opgebouwd en zijn de leermomenten van fouten uit het verleden toegepast, en het product weer verder verbeterd.</p>
<p><strong>Hoe het werkt</strong><br />
De scanner levert batches van tiff bestanden aan Ephesoft (de applicatie). Via een webbrowser kunnen medewerkers de scans valideren en herkende metadata eventueel corrigeren. Het systeem is dus in staat om naast het weer tekst maken van de gescande afbeelding, ook herkenning van metadata te realiseren. Denk aan NAW gegevens, documentnummers, barcodes, line items&#8230; Deze metadata kan vervolgens verderop in het proces worden meegegeven aan het DMS. Zoals gemeld kunnen medewerkers de metadata controleren en verbeteren waarna Ephesoft de gescande bestanden tesamen met de metadata via de <a title="CMIS 1.0 approved by OASIS" href="http://tpeelen.wordpress.com/2010/05/07/cmis-1-0-approved-by-oasis/" target="_blank">CMIS</a> standaard kan doorgeven aan het DMS. (Mits CMIS compliant natuurlijk.) Voor mij is het DMS <a href="http://alfresco.com" target="_blank">Alfresco</a>.</p>
<p>Dat zowel DMS als scan applicatie zowel web based als open source zijn, geeft enorme vrijheid om deze te implementeren in de organisatie en architectuur. Qua eventueel maatwerk bestaan veel voorbeelden (want: open source), en qua architectuur bestaal allerlei keuzen om bepaalde (of alle delen) &#8216;in de cloud&#8217; of bij een derde partij te hosten, terwijl de medewerkers volledig plaats en tijd onafhankelijk kunnen werken met slechts een webbrowser! Dit kan Het ultieme Nieuwe Werken!</p>
<p><strong>Ephesoft functionaliteit</strong></p>
<p>Ephesoft is de applicatie voor &#8216;intelligent document capture&#8217;. Het bestaat uit het volgende &#8216;modulaire&#8217; proces:<br />
<a href="http://www.allesovereim.nl/wp-content/uploads/2011/01/ephesoft-modules.png"><img class="alignnone size-full wp-image-441" title="ephesoft-modules" src="http://www.allesovereim.nl/wp-content/uploads/2011/01/ephesoft-modules.png" alt="" width="655" height="276" /></a></p>
<p><strong>Document Ingestion<br />
</strong>Ephesoft ontvangt content/documenten uit een bron. Dit kunnen natuurlijk gescande batches tiff documenten zijn (elke folder met tiff bestanden wordt als batch gezien). Het systeem kan echter ook gevoed worden door elk ander systeem, denk aan email (bericht met bijlagen) of content uit een DMS wat up uniforme wijze geclassificeerd kan worden en aan een DMS kan worden aangeboden ter archivering of opslag. De huidige 1.9 versie van de software maakt van email en bijlage PDF documenten die full-text indexeerbaar zijn en via het Ephesoft proces classificeerbaar zijn en waar metadata uit geëxtraheerd kan worden. Een open source tool om email te archiveren en van metadata te voorzien!</p>
<p><strong>OCR &amp; Barcode</strong><br />
De volgende stap in het proces is om de feitelijke tekst van de afbeelding of het document te verkrijgen. Als het gaat over een scan, komt dot neer op OCR (Optical Character Recognition). Ephesoft maakt gebruik van een modulair stysteem, en er is keuze welke OCR engine hiervoor te gebruiken. De community versie komt geconfigurered met  <a href="http://code.google.com/p/tesseract-ocr/" target="_blank">Tesseract</a> als OCR engine, de Enterprise versie met <a href="http://www.captaris-dt.com/product/recostar-professional/en/" target="_blank">Recostar Professional</a>, een closed source OCR tool. Overigens zou ook  <a href="http://code.google.com/p/ocropus/" target="_blank">ORCopus</a> kunnen worden ingezet als open source ORC engine, als deze nog niet standaard configureerbaar.</p>
<p>Documenten die oorspronkelijk uit een gecontroleerde omgeving komen zoals een DMS,  zouden voorzien kunnen zijn van enige vorm van barcodes. Ephesoft wordt standaard geleverd met de mogelijkheid om <a href="http://nl.wikipedia.org/wiki/Code_39" target="_blank">Code39</a> barcodes (de &#8216;normale&#8217; 1 dimensionale barcodes, zoals bekend uit de supermarkt), <a href="http://nl.wikipedia.org/wiki/QR-code" target="_blank">QR codes</a> (2 dimensionale codes) , and <a href="http://nl.wikipedia.org/wiki/Data_matrix" target="_blank">datamatrix</a> codes (ook 2 dimensional). De 1-dimensionale barcode kan typisch gebruikt worden voor iets als een document/klant/briefnumer, en de 2 dimensional versie kan veel meer informatie bevatten. (QR codes wordne ondermeer gebruikt om de link naar (intranet/DMS?) webpagina&#8217;s te bevatten.</p>
<p><strong>Classification (and Separation)<br />
</strong>Ephesoft kan leren hoe de eerste en laatste pagina&#8217;s van een document er uitzien. Met deze informatie kan een stapen documenten ineens gescand worden, en is het niet meer nodig om scheidingsvellen tussen de te scannen documenten op te nemen. De gescande velletjes worden vanaf dat moment als een document beschouwd. Het systeem kan verschillende document types herkennen, met verschillende begin/eindpagina&#8217;s, op basis van de layout en het voorkomen van zaken als keywords, barcodes en andere herkenbare &#8216;landmarks&#8217;.</p>
<p>Voordeel is dat men zich in de scanstraat niet meer druk hoeft te maken over scheidingspagina&#8217;s, er kan gewoon een stapel originelen worden gescand en het systeem kan herkennen welke pgina&#8217;s een document vormen. Dit kan veel tijd en moeite schelen.</p>
<p><strong>Extraction</strong><br />
Een van de mooie functies van Ephesoft is dat het entiteiten kan herkennen binnen een document. Zaken als namen, adressen, postcodes, klantnummers etc. kan worden herkend en opgeslagen als metadataveld. Dit is van enorme meerwaarde als het document aan een DMS wordt toegevoegd. Een DMS kan vervolgens op basis van deze aanvullende/beschrijvende metadata routering bepalen, of rapportages en overzichten genereren.</p>
<p><strong>Distribution<br />
</strong>Als de documenten gescand, van tekstlaag en metadata (extractie) zijn voorzien, en naar pdf zijn geconverteerd, moet Ephesoft ze &#8216;ergens laten&#8217;.  Ephesoft community wordt geleverd met twee eindpunten voor deze pdf&#8217;s. De meest basale is dat de bestanden naar een (netwerk)schijf worden weggeschreven. Een nadeel is dat een bestand op de netwerkschijf vaak niet alle metadata kan bevatten die eerder herkend is. Wel behoud het de voordelen vna een volledig geindexeerd en doorzoekbaar pdf document. Er zijn natuurlijk toepassingen waar dit ongewenst is.</p>
<p>Het andere alternatief is dat het pdf bestand via de CMIS standaard aan een ander systeem wordt overgedragen. <a href="http://www.oasis-open.org/committees/tc_home.php?wg_abbrev=cmis" target="_blank">CMIS is een open standaard</a> onderhouden door het OASIS consortium. CMIS staat voor Content Management Interoperability Standard, wat ik al eerder heb <a title="CMIS 1.0 approved by OASIS" href="http://tpeelen.wordpress.com/2010/05/07/cmis-1-0-approved-by-oasis/" target="_blank">beschreven</a>. CMIS heeft de fantastische mogelijkheid dat zowel het document als de metadata kan worden uitgewisseld. Ephesoft kan vervolgens dit CMIS &#8216;end point&#8217; configureren dat de pdf versie (of desgewenst (ook) de tiff) van de scans met metadata naar Alfresco kan worden overgezet.  (Lees verder in &#8220;<a title="Configuring Ephesoft and Alfresco for CMIS integration" href="http://tpeelen.wordpress.com/2010/12/23/configuring-ephesoft-and-alfresco-for-cmis-integration/" target="_blank">Configuring Ephesoft and Alfresco for CMIS integration</a>&#8220;; in English).</p>
<p><strong>User interface om Batches te verwerken</strong><br />
De Ephesoft applicatie heeft twee types web-based interface. De eerste is bedoeld voor de gebruikers die de kwaliteit van de scans en de metadata in de gaten houden of verbeteren. De Ephesoft engine doet zijn best om de metadata te herkennen, maar dit zal waarschijnlijk nooit 100% zijn. In deze interface krijgen gebruikers overzicht over de gescande batches in termen van prioriteit en status. Per batch kunnen de documenten gevalideerd worden, pagina&#8217;s worden verplaatst, geroteerd (of verwijderd) en de metadata die niet correct is herkend kan worden verbeterd of aangevuld, zoals in de afbeelding hieronder. Hoewel Ephesoft een web-applicatie is, kan de gebruiker gebruik maken van een groot aantal keyboard shortcuts om de effectiviteit te verhogen.  (Voor verdere details, zie de <a href="http://www.ephesoft.com/wiki/index.php?title=User_Manual" target="_blank">User Manual</a>)</p>
<p><a href="http://tpeelen.files.wordpress.com/2010/12/user-validation.png"><img class="aligncenter size-full wp-image-226" title="Validation" src="http://tpeelen.files.wordpress.com/2010/12/user-validation.png" alt="" width="500" height="325" /></a></p>
<p><strong>User inferface om het systeem te beheren (e.g. admin interface)<br />
</strong>Het Ephesoft systeem moet natuurlijk ook beheerd worden. Met de administratie interface kan men de Batches configureren. Per batch klasse kunnen Modules worden geactiveerd en geconfigureerd.  Zo kan de ene Batch klasse een CMIS endpointhebben naar  systeem A, de documenten in een andere Batch klasse worden afgeleverd in systeem B, en de documenten uit een derde klasse worden opgeslagen op een folder op een netwerkschijf.  (Voor meer details, zie de <a href="http://www.ephesoft.com/wiki/index.php?title=Admin_Manual" target="_blank">Admin Manual</a>).</p>
<p><a href="http://tpeelen.files.wordpress.com/2010/12/admin.png"><img class="aligncenter size-full wp-image-214" title="admin" src="http://tpeelen.files.wordpress.com/2010/12/admin.png" alt="" width="500" height="399" /></a></p>
<p>In dit screenshot kunnen de modules van de huidige Batch klasse worden geselecteerd om te configureren.</p>
<p>Het is een beetje jammer dat het beheer van gebruikers is gedelegeerd naar een applicatieserver. Vanuit een business standpunt is dit geen ramp, het is gebruikelijk dat een applicatieserver koppelt met een systeem als Active Directory. De community versie wordt geleverd met Tomcat als applicatieserver, waarbij de gebruikers terug te vinden zijn in de user.xml file van Tomcat.</p>
<p><strong>Ephesoft vanuit technisch perspectief<br />
</strong>Ephesoft is een Java gebaseerde web-applicatie die draait op een server. Dit betekent dat de gebruikers alleen maar een webbrowser nodig hebben! De server gebruikt JBPM als basis voor het modulaire proces. Elke module kan worden geconfigureerd, en eenvoudig worden aan- of uitgezet, of worden vervangen door een module met gelijksoortige functionaliteit.</p>
<p>De server is ontworpen om te kunnen functioneren in een cluster (om single-point-of-failure te vermijden en een hoge erg beschikbaarheid te kunnen garanderen) en tevens voor gebruik &#8216;in de cloud&#8217;. Door deze ontwerp-beslissingen zijn robuuste en hedendaagse architecturen te realiseren. Waarom de server in eigen beheer draaien en niet in de cloud? Parameters zoals scan volume, beschikbare bandbreedte, de spreiding van de organisatie over het land/continent/wereld beinvloeden mede hoe een ideale architectuur er uit kan zien. Ephesoft kan zich aanpassen aan vele architecturen, en zal niet gauw in de weg zitten.</p>
<p style="text-align: center;"><a href="http://www.allesovereim.nl/wp-content/uploads/2011/01/ephesoft-tech-schema.png"><img class="size-full wp-image-442 aligncenter" title="ephesoft-tech-schema" src="http://www.allesovereim.nl/wp-content/uploads/2011/01/ephesoft-tech-schema.png" alt="" width="273" height="165" /></a></p>
<p><a href="http://tpeelen.files.wordpress.com/2010/12/technial-architecture1.png"></a></p>
<p>De Ephesoft applicatie is een Java application die draait in een Applicatie Server. De community versie wordt geleverd met Tomcat, maar specifieke versies van  JBoss, Weblogic en Websphere worden ook ondersteund. De applicatie gebruikt ImageMagick voor de grafische transformaties (schalen, van tiff naar png). De OCR module binnen Ephesoft kan worden vervangen. De Enterprise versie wordt geleverd met  Recostar Processional, Community komt met Tesseract. In mijn beleving zou Tesseract ook nog vervangen kunnen worden door ORCopus.</p>
<p>hOCR staat voor de tool die de tiff&#8217;s kan combineren met de tekst laag (in de .hocr files) tot een pdf file (evt. met meerdere pagina&#8217;s per document). Deze .horc files bevatten zowel de text die herkend is van de afbeelding, alsook de locatie van de woorden/letters op de pagina. Net zoals Tesseract, is ook deze tool is beschikbaar voor zowel Windows als Linux. Op moment van schrijven was MySQL de enige ondersteunde database, maar op de korte termijn worden ook MSSQL, oracle, Postgress en DB2 ondersteund. De actuele technische details kunnen <a href="http://www.ephesoft.com/services/subscription/supported-platforms" target="_blank">online</a> worden teruggevonden.</p>
<p><strong>Het business model</strong><br />
Ephesoft kent een vergelijkbaar subscription model als Alfresco. De Community Edition komt onder de  GPL v2 license, en is dus gratis te gebruiken, zonder ondersteuning van Ephesoft, zonder garanties. U bent dan aangewezen op de wiki, fora, internet etc. De Enterprise Edition is verder getest en wordt geleverd met een commerciele (kwalitatief betere)  OCR oplossing. De subscription is gebaseerd op het aantal CPU&#8217;s die in gebruik zijn op de server, <em>niet </em>door het aantal gebruikers, aantal scans of andere beperkingen. Er bestaan een aantal nivo&#8217;s van ondersteuning, van het inschieten van issues tot 24/7 ondersteuning. Zie de Ephesoft <a href="http://www.ephesoft.com/services/subscription/support" target="_blank">website</a> voor meer details.</p>
<p><strong>Het &#8216;bewijs&#8217;<br />
</strong>Ik heb flink met Ephesoft gestoeid om het (op mijn manier) technisch werkend te krijgen. Naast wat technische details waar ik tegenaangelopen ben, leer ik ook graag grenzen (en verkrijg ik inzcht) door over deze grenzen heen te gaan. Ik had mij een aantal doelen gesteld:</p>
<ol>
<li>Configureer Ephesoft zodanig dat de resulterende pdf&#8217;s in Alfresco worden opgeslagen middels CMIS. Dit is gelukt, maar niet met de mate van detail die ik had verwacht. Zie &#8220;<a title="Configuring Ephesoft and Alfresco for CMIS integration" href="http://tpeelen.wordpress.com/2010/12/23/configuring-ephesoft-and-alfresco-for-cmis-integration/">Configuring </a><span style="color: #000000;"><a title="Configuring Ephesoft and Alfresco for CMIS integration" href="http://tpeelen.wordpress.com/2010/12/23/configuring-ephesoft-and-alfresco-for-cmis-integration/">Ephesoft and Alfresco using CMIS integration</a></span>&#8221; voor de details (in English). De eindconclusie is: ja het werkt.  Vooral voor de &#8216;simpelere&#8217; attribuut types. In de inmiddels vorige  community version (1.8.1.6) ging het CMIS transportmis voor data types als Long and Double (CMIS kent alleen Integer en Decimal). Dit blijkt mede te zijn opgelost door als String de waarden over te dragen.</li>
<li>installeer Ephesoft en Alfresco in een enkele  Tomcat instance. Dit is geen real-life scenario, in een productie omgeving zullen deze juist gescheiden zijn. Het geeft echter wel een idee welke componenten, libraries en omgevingsvariabelen nodig zijn, en hoe e.e.a. geconfigureerd is, en hoe dit te tweaken is. Bovendien is het aantrekkelijker een enkele VMware op te starten voor demo doeleinden. Ik heb dit uitgeprobeerd op het Windows platform, en de conclusie is: &#8216;Bijna klaar&#8217;. Ik heb beide applicaties in een enkele Tomcat geinstalleerd, en uiteindelijk liep de stap van het samenvoegen van tiff en hocr tot pdf bestand mis. Zie &#8220;<span style="color: #ff0000;"><span style="color: #0000ff;">Ephesoft and Alfresco into one Tomcat instance</span></span>&#8221; voor meer details (gestaakt, wekens wisselen van versies, installaties, en beperkte vrije tijd).</li>
<li>Als Open Source adept draait een server &#8216;natuurlijk&#8217; Linux. &#8216;Helaas&#8217; blijken de huidige klanten van Ephesoft allemaal Windows te draaien, dus het lijkt vooral mijn probleem <img src='http://www.allesovereim.nl/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> . Aangezien het om een Java applicatie gaat, zou dit niet al te complex zijn. De crux zal zitten in de helperapplicaties als Tesseract, ImageMagick en hOCR. mijn eerste stap is om Tesseract op Linux werkend te krijgen (Bij de Ephesoft Windows distributie wordt dit werkend meegeleverd). Dat was eenvoudig, zie &#8220;<a title="Alfresco using Tesseract OCR on Ubuntu Linux" href="http://tpeelen.wordpress.com/2010/12/17/alfresco-using-tesseract-ocr-on-ubuntu-linux/">Alfresco using Tesseract OCR on Ubuntu Linux</a>&#8221; (English). De volgende stap is om de verdere applicatie werkend te krijgen op Linux (zie &#8220;<a title="DRAFT: Install Ephesoft on Ubuntu Linux" href="http://tpeelen.wordpress.com/2011/01/16/draft-ephesoft-on-ubuntu-linux/" target="_blank">DRAFT: <span style="color: #0000ff;">Install Ephesoft on Ubuntu Linux</span></a>&#8221; voor de details &#8211; English, en nadrukkelijk &#8216;draft&#8217;). Dit is uiteindelijk nog niet afgerond. Enerzijds door tijdgebrek (het is hobby-project voor mij), anderzijds (b)lijken er een aantal paden hardcoded te zijn voor Windows. Het systeem wil perse de windows TesseractConsole.exe aanroepen, en die bestaat niet in Linux wereld. Ik wacht nog op wat vrije tijd om de broncode door te nemen en aan te passen, maar aangezien dit een project is in eigen tijd&#8230;</li>
</ol>
<p><strong>The near future<br />
</strong>De Nederlandse versie van deze blog is ingehaald door de realiteit. Inmiddels is de 1.9 versie van Ephesoft vrijgegeven. Deze maakt van Ephesoft een krachtige email-classificatie tool. In de Document ingestion fase kan naast de gescande tiff ook email worden &#8216;ingevoerd&#8217;. Email met bijlage worden naar pdf geconverteerd, en alle features zoals entity extractie kunnen hierop worden uitgevoerd! Daarnaast worden binnenkort verwacht:</p>
<ul>
<li>Form processing, zone OCR/ICR/OMRPDF/</li>
<li>Multi page tiff import</li>
<li>Table extraction</li>
<li>veel meer&#8230;</li>
</ul>
<p>Daarnaast worden &#8216;groepen&#8217; geintroduceerd, zodat batch classes aan bepaalde groepen kunnen worden gekoppeld.  Ik kijk erg uit naar hands-on tijd met de nieuwe 1.9 release&#8230;</p>
<p><strong>Mijn conclusie</strong></p>
<p>Allereerst: Wat een fantastisch product. En een pluim voor de respons van de mensen van Ephesoft, men reageert heel snel en uitgebreid op vragen en foutrapporten.</p>
<p>Vanuit een architectuur standpunt vind ik de 100% server/web-based oplossing interessant. Gebruikers hebben alleen een webbrowser nodig. Ideaal voor HetNieuweWerken! De mogelijkheden zijn krachtig, ik kan het wel zien werken&#8230;</p>
<p>Ik ben erg fan van de Document Ingestion fase. Natuurlijk zijn scans slechts een van de vele stromen informatie die geclassificeerd en van metadata voorzien dient te worden. Het ligt erg voor de hand dat het ongeacht de stroom, door dezelfde logica heen gaat! Of de documenten nou vanuit scan, email of een DMS komen, de extractie logica is op deze wijze eenduidig.</p>
<p>Downside is dat het product relatief nieuw is. In het licht van open source betekent dit dat nog geen levendige community bestaat, maar nog  in opbouw is. Zo ontdekte ik dat de Issue Management oplossing nog in ontwikkeling is, maar aan de andere kant, het product moet ook ontwikkeld worden en er moeten klanten gevonden worden, ook Ephesoft kan de tijd maar eenmaal besteden. De wiki is in opbouw, evenals de discussie fora. er is wel degelijk aandacht voor de documentatie, in de wiki zijn recentelijk weer mooie tutorials toegevoegd. De website communiceert helder wat er in een volgende release verwacht kan worden, en wanneer deze release gescheduled staat. Tot op heden wordt er prima naar planning geleverd!</p>
<p>Het beheer van gebruikers is een punt van aandacht. Aan de ene kant hoeft niet elke applicatie zelf aan gebruikersbeheer doen. Aan de andere kant, als er geen fatsoenlijke applicatieserver is (liefst met koppeling naar AD) zou het verdomd handig zijn als er wel een kaal minimum is, wat iets meer kan bieden dan de users.xml in Tomcat&#8230;</p>
<p>Ik was licht teleurgesteld door de CMIS integratie. Het mappen van de pdf output op de standaard cmis:document ging prima. Het werd spannend toen ik de datatypes in Alfresco gelijk trok aan de datatypes in Ephesoft. CMIS voorziet niet in alle data types, en het bleek dat sommige types als String werden aangeboden. Dat moet de ontvangende Alfresco kant natuurlijk ook weten&#8230;</p>
<p>Ik vind het een mooie tool, ben blij verrast door de breedte van de oplossing, en ik heb een warm gevoel bij de Ephesoft organisatie.</p>
<p><strong>Mijn to-do lijst</strong></p>
<ul>
<li>Ik wil een onderzoek doen om de kwaliteit van OCR te kunnen vergelijken tussen de open source en de closed source OCR oplossingen.</li>
<li>Ik wil graag de code bekijken en bezien waar deze kan worden aangepast om de helper tools voor de verschillende platform te kunnen configureren. Daarna kan ik verder met mijn alles-op-Linux experiment.</li>
</ul>
<p>[update 16 jan 2011: toegevoegd link naar "DRAFT: install Ephesoft on Ubuntu Linux"]</p>
<div class="shr-publisher-428"></div><!-- Start Shareaholic LikeButtonSetBottom Automatic --><!-- End Shareaholic LikeButtonSetBottom Automatic -->]]></content:encoded>
			<wfw:commentRss>http://www.allesovereim.nl/2011/01/open-source-scanning-met-ephesoft-en-alfresco/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Tjarda Peelen over aanbesteden van Open Source</title>
		<link>http://www.allesovereim.nl/2010/12/tjarda-peelen-over-aanbesteden-van-open-source/</link>
		<comments>http://www.allesovereim.nl/2010/12/tjarda-peelen-over-aanbesteden-van-open-source/#comments</comments>
		<pubDate>Mon, 27 Dec 2010 21:55:58 +0000</pubDate>
		<dc:creator>Paul Baan</dc:creator>
				<category><![CDATA[Business]]></category>
		<category><![CDATA[aanbesteden]]></category>
		<category><![CDATA[aanbesteding]]></category>
		<category><![CDATA[aanbestedingsrecht]]></category>
		<category><![CDATA[alfresco]]></category>
		<category><![CDATA[document management]]></category>
		<category><![CDATA[Enterprise Content Management]]></category>
		<category><![CDATA[open source]]></category>

		<guid isPermaLink="false">http://www.allesovereim.nl/?p=421</guid>
		<description><![CDATA[Video met uitleg van Tjarda Peelen over het aanbesteden van Open Source ]]></description>
			<content:encoded><![CDATA[<!-- Start Shareaholic LikeButtonSetTop Automatic --><!-- End Shareaholic LikeButtonSetTop Automatic --><p>Recent heeft de Europese ombudsman een uitspraak gedaan over wanneer Open Source moet worden aanbesteed en wanneer niet. Deze uitspraak heeft nogal gevolgen voor Open Source oplossingen met een gesupporteerde versie. Tjarda Peelen legt uit.</p>
<p><a href='http://www.youtube.com/watch?v=z_C3LPpcr1c&#038;feature=player_embedded'>Tjarda Peelen over Open Source aanbestedingen</a></p>
<div class="shr-publisher-421"></div><!-- Start Shareaholic LikeButtonSetBottom Automatic --><!-- End Shareaholic LikeButtonSetBottom Automatic -->]]></content:encoded>
			<wfw:commentRss>http://www.allesovereim.nl/2010/12/tjarda-peelen-over-aanbesteden-van-open-source/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Kennis delen of kennis(sen) halen ?</title>
		<link>http://www.allesovereim.nl/2010/09/kennis-delen-of-kennissen-halen/</link>
		<comments>http://www.allesovereim.nl/2010/09/kennis-delen-of-kennissen-halen/#comments</comments>
		<pubDate>Wed, 29 Sep 2010 10:21:06 +0000</pubDate>
		<dc:creator>Johan van der Kooij</dc:creator>
				<category><![CDATA[Business]]></category>
		<category><![CDATA[document management]]></category>
		<category><![CDATA[enterprise information management]]></category>
		<category><![CDATA[kennismanagement]]></category>
		<category><![CDATA[social media]]></category>

		<guid isPermaLink="false">http://www.allesovereim.nl/?p=306</guid>
		<description><![CDATA[Voor vrijwel iedere organisatie is kennismanagement een uitdaging. Hoe zorg ik ervoor dat alle medewerkers op de hoogte zijn van relevante zaken. Als het echt belangrijk is (bijvoorbeeld wijziging in arbeidsvoorwaarden), dan ontvangen de medewerkers een brief op hun huisadres, voor veel andere communicatie (bijvoorbeeld locatie en tijdstip bijeenkomsten) is e-mail een algemeen geaccepteerd communicatiemiddel. [...]]]></description>
			<content:encoded><![CDATA[<!-- Start Shareaholic LikeButtonSetTop Automatic --><!-- End Shareaholic LikeButtonSetTop Automatic --><p>Voor vrijwel iedere organisatie is kennismanagement een uitdaging. Hoe zorg ik ervoor dat alle medewerkers op de hoogte zijn van relevante zaken. Als het echt belangrijk is (bijvoorbeeld wijziging in arbeidsvoorwaarden), dan ontvangen de medewerkers een brief op hun huisadres, voor veel andere communicatie (bijvoorbeeld locatie en tijdstip bijeenkomsten) is e-mail een algemeen geaccepteerd communicatiemiddel.<span id="more-306"></span></p>
<p>De mailfunctie &#8220;Send All&#8221; wordt hierbij vaak gebruikt, en enkele jaren geleden leverde dat zelfs nog veel conversaties op waarbij de ontvangers vrolijk ook op &#8220;Reply All&#8221; drukten om hun mening kenbaar te maken.  Voor meer statische kennis (documentatie) is de gedeelde netwerkschijf een populair opslagmedium, de afgelopen jaren veelal vervangen door een documentmanagement omgeving.</p>
<p>Naast deze digitale functies zijn er natuurlijk ook vergaderingen en andere formele en informele ontmoetingsstructuren waarbij kennis wordt gedeeld. De vraag blijft hierbij in hoeverre al deze communicatiekanalen een doel vervullen. Vraag of aanbod gestuurd communiceren is een interessant vraagstuk. Reguliere of ad-hoc kennis- en informatiedeling. In de kern komt het neer op kennis delen of kennis halen. En, zoals de titel van deze blog al impliceert: bij kennis halen kan het gebruik van sociale netwerken een interessante rol vervullen. Een sociaal netwerk, open (Twitter) of gesloten (Yammer), kan mensen met elkaar in contact brengen op een laagdrempeliger manier dan telefoon of e-mail.</p>
<p>Het kennisnetwerk faciliteert &#8211; vanuit een technische (tool) insteek &#8211; de communicatie, en zorgt ervoor dat kennis(sen) met elkaar in contact gebracht worden. Dus in plaats van het pro-actief communiceren, gaan we passief afwachten tot er vragen komen, en vervullen de kenniswerkers de intermediair-rol in het bij elkaar brengen van vraag en aanbod.</p>
<p>Zijn er risico&#8217;s verbonden aan deze methode ? Ja: medewerkers die niet gewend zijn aan sociale netwerken (of die er een aversie tegen hebben) vallen deels buiten de boot. En bij de inzet van deze nieuwe technologie zie je ook typisch de longtaileffecten optreden: een kleine groep mensen die erg actief is en een grote groep mensen die er nauwelijks gebruik van maakt.</p>
<p>Waarom &#8211; met deze risico&#8217;s in het achterhoofd &#8211; dan toch gebruik maken van deze sociale netwerktechnologie voor kennisdeling ? Omdat mensen steeds bekender worden met deze fenomenen doordat ze heel goed aansluiten bij de menselijke behoefte tot &#8216;losse&#8217; communicatie. Roep maar wat en er is altijd wel iemand die reageert. Deze behoefte kan ten volle worden ondersteund door sociale media, maar er zullen altijd laggards zijn. Maar die zullen onafhankelijk van de ingerichte methode vrijwel altijd bij de laggards behoren.</p>
<div class="shr-publisher-306"></div><!-- Start Shareaholic LikeButtonSetBottom Automatic --><!-- End Shareaholic LikeButtonSetBottom Automatic -->]]></content:encoded>
			<wfw:commentRss>http://www.allesovereim.nl/2010/09/kennis-delen-of-kennissen-halen/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Case management, de derde ECM sales golf?</title>
		<link>http://www.allesovereim.nl/2010/09/case-management-de-derde-ecm-sales-golf/</link>
		<comments>http://www.allesovereim.nl/2010/09/case-management-de-derde-ecm-sales-golf/#comments</comments>
		<pubDate>Fri, 03 Sep 2010 12:22:58 +0000</pubDate>
		<dc:creator>Paul Baan</dc:creator>
				<category><![CDATA[Business]]></category>
		<category><![CDATA[Bpm]]></category>
		<category><![CDATA[Business Process Management]]></category>
		<category><![CDATA[Case management]]></category>
		<category><![CDATA[document management]]></category>
		<category><![CDATA[Enterprise Content Management]]></category>

		<guid isPermaLink="false">http://www.allesovereim.nl/?p=243</guid>
		<description><![CDATA[Ik snap het wel en ik snap het niet. Case management. Wat ik snap is dat er altijd een behoefte is om bestaande oplossingen te koppelen aan nieuwe of nieuw bedachte business problemen. Wat ik niet snap is dat diezelfde bestaande oplossingen dan ineens heel anders gepresenteerd moeten worden. Komt daar die IT terminologie overkill [...]]]></description>
			<content:encoded><![CDATA[<!-- Start Shareaholic LikeButtonSetTop Automatic --><!-- End Shareaholic LikeButtonSetTop Automatic --><p>Ik snap het wel en ik snap het niet. Case management. Wat ik snap is dat er altijd een behoefte is om bestaande oplossingen te koppelen aan nieuwe of nieuw bedachte business problemen. Wat ik niet snap is dat diezelfde bestaande oplossingen dan ineens heel anders gepresenteerd moeten worden. Komt daar die IT terminologie overkill vandaan?<br />
<span id="more-243"></span><br />
Eerst was er document management. Dat was simpel. Documenten moesten netjes worden opgeslagen en makkelijk terugvindbaar worden gemaakt. Logisch. Duidelijk werd dat documenten een levenscyclus hebben. Van eerste grove aanzet tot door alle instanties goedgekeurd. Workflow bood ondersteuning bij het doorlopen van dat proces. Prima, snap ik allemaal.</p>
<p>Toen kwam de tweede golf. Business Process Management deed zijn intrede. Tot op de dag van vandaag heeft niemand me helder kunnen uitleggen wat dat is, en vooral niet wat daar anders aan is dan wat we al deden. Maar het bracht de spanning wel weer even terug, dat is waar.</p>
<p>Kennelijk is de BPM hype een beetje overgewaaid, en was er behoefte aan een nieuwe trend. Voila case management. Forrester rapporteert braaf dat hiermee een oud idee wordt afgestoft en dat de tijd er nu kennelijk rijp voor is. Maar ook Forrester loopt vast in een goede definitie. Het lijkt nu een soort van ophoping van concepten uit ECM en BPM (uiteraard bouwen we wel voort op de verwarring die al gezaaid is).</p>
<p>Schiet mij maar lek. Als ik er met een dosis gezond boerenverstand en de nodige ECM achtergrondkennis naar kijk, zie ik leveranciers Case Management uitleggen als een preconfiguratie van hun softwareoplossing, die daardoor sneller implementeer is op veel voorkomende business uitdagingen. Handig!</p>
<p>Eigenlijk is de industrie dus bezig haar eerst zo generiek mogelijk ontwikkelde platformen nu pre-fab aan te bieden voor bepaalde doelstellingen. Dus waar je vroeger een aannemer kreeg op je vraag om een nieuw huis, krijg je nu een brochure met pre-fab mogelijkheden die hopelijk passen bij het soort huis dat je zoekt. En anders kun je altijd nog de aannemer inhuren.</p>
<p>Enfin, ik denk het hiermee begrepen te hebben, en vind de hele hype weer een hoop ingewikkeld gedoe voor iets wat eigenlijk heel simpel (en daarmee heel krachtig) is. Maar mocht ik er finaal naast zitten, dan hoor ik het graag!</p>
<div class="shr-publisher-243"></div><!-- Start Shareaholic LikeButtonSetBottom Automatic --><!-- End Shareaholic LikeButtonSetBottom Automatic -->]]></content:encoded>
			<wfw:commentRss>http://www.allesovereim.nl/2010/09/case-management-de-derde-ecm-sales-golf/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>NOiV: Open Source ECM voor gemeenten</title>
		<link>http://www.allesovereim.nl/2010/05/noiv-open-source-ecm-voor-gemeenten/</link>
		<comments>http://www.allesovereim.nl/2010/05/noiv-open-source-ecm-voor-gemeenten/#comments</comments>
		<pubDate>Mon, 17 May 2010 19:46:00 +0000</pubDate>
		<dc:creator>Paul Baan</dc:creator>
				<category><![CDATA[Business]]></category>
		<category><![CDATA[alfresco]]></category>
		<category><![CDATA[document management]]></category>
		<category><![CDATA[Enterprise Content Management]]></category>
		<category><![CDATA[gemeente]]></category>
		<category><![CDATA[open source]]></category>

		<guid isPermaLink="false">http://www.allesovereim.nl/?p=203</guid>
		<description><![CDATA[Het actieplan Nederland Open in Verbinding (NOiV) heeft tot doel overheidsinstanties aan te moedigen gebruik te maken van Open Standaarden en Open Source. Ondanks de toenemende mogelijkheden en de druk van de overheid lopen Nederlandse overheidsinstellingen achter bij andere Europese landen. Bas Peters van VLC heeft een whitepaper geschreven waarin de mogelijkheden van Open Source [...]]]></description>
			<content:encoded><![CDATA[<!-- Start Shareaholic LikeButtonSetTop Automatic --><!-- End Shareaholic LikeButtonSetTop Automatic --><p>Het actieplan Nederland Open in Verbinding (NOiV) heeft tot doel overheidsinstanties aan te moedigen gebruik te maken van Open Standaarden en Open Source. Ondanks de toenemende mogelijkheden en de druk van de overheid lopen Nederlandse overheidsinstellingen achter bij andere Europese landen.<br />
<span id="more-203"></span><br />
Bas Peters van VLC heeft een whitepaper geschreven waarin de mogelijkheden van Open Source Document Management (of Enterprise Content Management) worden beschreven, specifiek voor Nederlandse gemeentes. Daarin gaat hij ook in op de unieke eigenschappen die Alfresco heeft, en de professionele mogelijkheden die er voor beheer, implementatie en support van Alfresco te krijgen zijn. Het whitepaper laat zien dat er geen excuses meer zijn om als Nederland achter te lopen als het gaat om de toepassing van open source voor document management gerelateerde oplossingen.</p>
<p><a href="http://www.vlc.nl/sites/default/files/files/Alfresco%20open%20source%20alternatief.pdf">Het paper is te downloaden op de website van VLC</a>.</p>
<div class="shr-publisher-203"></div><!-- Start Shareaholic LikeButtonSetBottom Automatic --><!-- End Shareaholic LikeButtonSetBottom Automatic -->]]></content:encoded>
			<wfw:commentRss>http://www.allesovereim.nl/2010/05/noiv-open-source-ecm-voor-gemeenten/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

