7月 2012のアーカイブ
Apache FOPの日本語禁則処理について、最新の記事がないので検証してみました。
1.検証対象のPDFとXSL-FO文書
PDF http://okule.files.wordpress.com/2012/07/japanesehyphenation5.pdfからダウンロードできます。
XSL-FO文書 http://www7b.biglobe.ne.jp/~okule/okule/wordpress/download/JapaneseHyphenation5.foからダウンロードできます。
2.行頭禁則処理
結果は、予想通りであった。
3.行末禁則処理
左シングル引用符、左ダブル引用符及び、始め二重山括弧引用記号は、行頭禁則処理もされている。
4.分割禁止処理
連続する全角ダッシュ[—] (EM DASH)、三点リーダ[…] 及び、二点リーダ[‥] は、行頭禁則処理もされている。
5.総評
初期の頃のApache FOPは、日本語禁則処理がなされていなかったが、バージョン1.0では、上記の検証とおり、禁則処理がされていることを確認しました。日本語の禁則処理を実装してくれた人々に感謝いたします。
6.参照
3.1.7 行頭禁則 http://www.w3.org/TR/2012/NOTE-jlreq-20120403/ja/#characters_not_starting_a_line
3.1.8 行末禁則 http://www.w3.org/TR/2012/NOTE-jlreq-20120403/ja/#characters_not_ending_a_line
3.1.10 分割禁止 http://www.w3.org/TR/2012/NOTE-jlreq-20120403/ja/#unbreakable_character_sequences
©中條勝徳 and okulejp.com, 2012.
1.Barcode4Jの紹介
Barcode4Jは、Javaで実装されたオープンソースのバーコード生成ソフトです。 次の様式のバーコードが出力できます。Interleaved 2 of 5、ITF-14、Code 39、Code 128、Codabar、UPC-A、UPC-E、EAN-13、EAN-8、POSTNET、Royal Mail Customer Barcode、USPS Intelligent Mail、PDF417、DataMatrix、DataMatrix、QR Code。またSVG、EPS、PNG、JPEGなどの画像データに出力できます。Apache FOPの可能性と日本語設定のブログ記事にて、コンビニ請求書の例があります。またApache FOP、Barcode4j および ZXing を使用したQRコード付きPDFについては、Apache FOP、Barcode4j および ZXing を使用して、QRコード付きPDFファイルを生成する方法(日本語可能)のブログ記事にて掲載しています。
2.Apache FOPとの連携
Barcode4JをApache FOPのアドオンとして使用することにより、簡単にバーコードをPDFに出力できます。barcode4j.jarと、barcode4j-fop-ext.jarをクラスパスに追加します(ダウンロードサイトにあるbarcode4j-2.1.0-bin.zipに含まれています)。
3.XSL-FO文書への組み込み方
17行目のfo:instream-foreign-object要素下位に、Barcode4Jの独自の要素を追加します。名前空間は、http://barcode4j.krysalis.org/nsです。
18行目のbarcode要素のmessage属性で、バーコードの値を設定します。barcode要素の次は、バーコードの種類に対応した要素が出現します。下記の例の場合は、ean-128要素です。human-readable要素の子要素であるパターンpattern要素で目視文字の出力フォーマットを指定します。template要素では、AI、チェックディ ジットの計算方法とバーコードの内容(数字、英字の桁数)を指定します。AIは括弧でくくります。nは、数字、cdはチェックディ ジットを示します。cd0は チェックディ ジットの計算にAIを含む場合に使用します。template要素は任意で、message属性の値が、template要素で示した内容とあっているかどうか確認します。22行目の(91)n41+cd0は、AIは91、n41は41桁の数字、cd0は、AIと41桁の数字を含めたチェックディ ジットの計算結果を示します。またmodule-width要素でモジュール幅を指定できます。
図 1.barcode.fo
<?xml version="1.0" encoding="UTF-8" ?>
<fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format">
<fo:layout-master-set>
<fo:simple-page-master page-height="297mm" page-width="210mm" margin-top="0mm" margin-left="0mm" margin-right="0mm" margin-bottom="0mm" master-name="pageMaster">
<fo:region-body margin-top="30mm" margin-left="10mm" margin-right="10mm" margin-bottom="20mm" />
<fo:region-before display-align="after" region-name="header" extent="25mm" />
<fo:region-after region-name="footer" extent="15mm" />
<fo:region-start extent="8mm" />
<fo:region-end extent="8mm" />
</fo:simple-page-master>
</fo:layout-master-set>
<fo:page-sequence master-reference="pageMaster">
<fo:flow flow-name="xsl-region-body">
<fo:block>EAN-128</fo:block>
<fo:block>
<fo:instream-foreign-object>
<barcode xmlns="http://barcode4j.krysalis.org/ns" message="9176643219876543210987654321098765432109178">
<ean-128>
<height>15mm</height>
<module-width>0.21mm</module-width>
<template>(91)n41+cd0</template>
<human-readable>
<pattern>__________-____________________________-_-______-_</pattern>
</human-readable>
</ean-128>
</barcode>
</fo:instream-foreign-object>
</fo:block>
</fo:flow>
</fo:page-sequence>
</fo:root>
図 2.PDFバーコード付きPDF(クリックするとPDFを表示します。)

参照
FOP add-ons
http://xmlgraphics.apache.org/fop/resources.html#products-fop-add-ons
Instructions for the Apache FOP extension
http://barcode4j.sourceforge.net/2.1/fop-ext.html
©中條勝徳 and okulejp.com, 2012.
Figure 1.実行計画 DB2 v9.7.5

Figure 2.実行計画 DB2 v10.1.0

DB2 Express-C 9.7.5では、fn:starts-withを使用した場合、pureXML専用のインデックススキャンであるXISCANは使用されてなかったが、DB2 Express-C 10.1.0では使用されるようになった。前方検索するときに、XISCANが実行されることを強く望んでいたので、大変喜ばしいことである。理由は、当然インデックス索引を使用されないと、100万レコードみたいな大量のXML文書の検索のときに時間がとてもかかるからである。
Figure 3. SQL
SELECT * FROM OKULE.CLIENTS
WHERE xmlexists(
'$c//phone/*[fn:starts-with(.,"5" )]'
passing OKULE.CLIENTS.CONTACT AS "c"
)
©中條勝徳 and okulejp.com, 2012.