<HTML><HEAD>
<META content="text/html; charset=iso-8859-15" http-equiv=Content-Type>
<META name=GENERATOR content="MSHTML 8.00.6001.18828"></HEAD>
<BODY style="MARGIN: 4px 4px 1px; FONT: 10pt Microsoft Sans Serif">
<DIV>Morning all,</DIV>
<DIV> </DIV>
<DIV>I made a bit of a mess. </DIV>
<DIV>A while back I uploaded some PDF documents to DSpace and ran Filter media to extract the text. Recently the creators of the pdf files sent me a batch with updated volume numbers etc to replace the existing ones already on the server. So I simply removed the items and added new bitstreams. And in the back of my mind I remember something about that not really being the right thing to do.</DIV>
<DIV>Now when I run the filter media process again the text doesn't get extracted - could this be because the checksums don't match or because the original was located in one assetstore and the new one in another?</DIV>
<DIV> </DIV>
<DIV>Thank you in advance</DIV>
<DIV> </DIV>
<DIV> </DIV>
<DIV>ERROR filtering, skipping bitstream:</DIV>
<DIV> </DIV>
<DIV>        Item Handle: 10394/1886<BR>        Bundle Name: ORIGINAL<BR>        File Size: 287223<BR>        Checksum: 6de2597a7cabd6ca3a995c355d9301f1 (MD5)<BR>        Asset Store: 1<BR>java.lang.NullPointerException<BR>java.lang.NullPointerException<BR>        at org.pdfbox.pdmodel.PDPageNode.getAllKids(PDPageNode.java:194)<BR>        at org.pdfbox.pdmodel.PDPageNode.getAllKids(PDPageNode.java:182)<BR>        at org.pdfbox.pdmodel.PDDocumentCatalog.getAllPages(PDDocumentCatalog.java:226)<BR>        at org.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:216)<BR>        at org.dspace.app.mediafilter.PDFFilter.getDestinationStream(PDFFilter.java:141)<BR>        at org.dspace.app.mediafilter.MediaFilterManager.processBitstream(MediaFilterManager.java:668)<BR>        at org.dspace.app.mediafilter.MediaFilterManager.filterBitstream(MediaFilterManager.java:570)<BR>        at org.dspace.app.mediafilter.MediaFilterManager.filterItem(MediaFilterManager.java:520)<BR>        at org.dspace.app.mediafilter.MediaFilterManager.applyFiltersItem(MediaFilterManager.java:488)<BR>        at org.dspace.app.mediafilter.MediaFilterManager.applyFiltersAllItems(MediaFilterManager.java:427)<BR>        at org.dspace.app.mediafilter.MediaFilterManager.main(MediaFilterManager.java:359)</DIV>
<DIV> </DIV>
<DIV> </DIV>
<DIV>Louw Venter<BR><A href="mailto:Louw.Venter@nwu.ac.za">Louw.Venter@nwu.ac.za</A></DIV>
<DIV><BR>Ferdinand Postma Biblioteek | Library<BR>Potchefstroomkampus van die Noordwes-Universiteit / <BR>Potchefstroom Campus of the North-West University<BR>Privaatsak | Private Bag X05<BR>Noordbrug<BR>2522<BR>(018) 299 2812</DIV>
<DIV> </DIV>
<DIV> </DIV>
<P><FONT face=Arial>Vrywaringsklousule / Disclaimer: </FONT><U><A href="http://www.nwu.ac.za/it/gov-man/disclaimer.html"><FONT color=#0000ff face=Arial>http://www.nwu.ac.za/it/gov-man/disclaimer.html </FONT></A></U></P></BODY></HTML>