7月 2012のアーカイブ

Apache FOPの日本語禁則処理について   Leave a comment

Apache FOPの日本語禁則処理について、最新の記事がないので検証してみました。

1.検証対象のPDFとXSL-FO文書
PDF              http://okule.files.wordpress.com/2012/07/japanesehyphenation5.pdfからダウンロードできます。
XSL-FO文書   http://www7b.biglobe.ne.jp/~okule/okule/wordpress/download/JapaneseHyphenation5.foからダウンロードできます。

2.行頭禁則処理
結果は、予想通りであった。

3.行末禁則処理
左シングル引用符、左ダブル引用符及び、始め二重山括弧引用記号は、行頭禁則処理もされている。

4.分割禁止処理
連続する全角ダッシュ[—] (EM DASH)、三点リーダ[…] 及び、二点リーダ[‥] は、行頭禁則処理もされている。

5.総評
初期の頃のApache FOPは、日本語禁則処理がなされていなかったが、バージョン1.0では、上記の検証とおり、禁則処理がされていることを確認しました。日本語の禁則処理を実装してくれた人々に感謝いたします。

6.参照
3.1.7 行頭禁則    http://www.w3.org/TR/2012/NOTE-jlreq-20120403/ja/#characters_not_starting_a_line
3.1.8 行末禁則    http://www.w3.org/TR/2012/NOTE-jlreq-20120403/ja/#characters_not_ending_a_line
3.1.10 分割禁止  http://www.w3.org/TR/2012/NOTE-jlreq-20120403/ja/#unbreakable_character_sequences

©中條勝徳 and okulejp.com, 2012.

広告

okule による FOP, XML への投稿 (7月 28, 2012)

タグ: , , , , ,

バーコード付きPDFの作成   Leave a comment

1.Barcode4Jの紹介
Barcode4Jは、Javaで実装されたオープンソースのバーコード生成ソフトです。 次の様式のバーコードが出力できます。Interleaved 2 of 5、ITF-14、Code 39、Code 128、Codabar、UPC-A、UPC-E、EAN-13、EAN-8、POSTNET、Royal Mail Customer Barcode、USPS Intelligent Mail、PDF417、DataMatrix、DataMatrix、QR Code。またSVG、EPS、PNG、JPEGなどの画像データに出力できます。Apache FOPの可能性と日本語設定のブログ記事にて、コンビニ請求書の例があります。またApache FOP、Barcode4j および ZXing を使用したQRコード付きPDFについては、Apache FOP、Barcode4j および ZXing を使用して、QRコード付きPDFファイルを生成する方法(日本語可能)のブログ記事にて掲載しています。

2.Apache FOPとの連携
Barcode4JをApache FOPのアドオンとして使用することにより、簡単にバーコードをPDFに出力できます。barcode4j.jarと、barcode4j-fop-ext.jarをクラスパスに追加します(ダウンロードサイトにあるbarcode4j-2.1.0-bin.zipに含まれています)。

3.XSL-FO文書への組み込み方
17行目のfo:instream-foreign-object要素下位に、Barcode4Jの独自の要素を追加します。名前空間は、http://barcode4j.krysalis.org/nsです。
18行目のbarcode要素のmessage属性で、バーコードの値を設定します。barcode要素の次は、バーコードの種類に対応した要素が出現します。下記の例の場合は、ean-128要素です。human-readable要素の子要素であるパターンpattern要素で目視文字の出力フォーマットを指定します。template要素では、AI、チェックディ ジットの計算方法とバーコードの内容(数字、英字の桁数)を指定します。AIは括弧でくくります。nは、数字、cdはチェックディ ジットを示します。cd0は チェックディ ジットの計算にAIを含む場合に使用します。template要素は任意で、message属性の値が、template要素で示した内容とあっているかどうか確認します。22行目の(91)n41+cd0は、AIは91、n41は41桁の数字、cd0は、AIと41桁の数字を含めたチェックディ ジットの計算結果を示します。またmodule-width要素でモジュール幅を指定できます。

図 1.barcode.fo

<?xml version="1.0" encoding="UTF-8" ?>
<fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format">
  <fo:layout-master-set>
    <fo:simple-page-master page-height="297mm" page-width="210mm" margin-top="0mm" margin-left="0mm" margin-right="0mm" margin-bottom="0mm"  master-name="pageMaster">
      <fo:region-body margin-top="30mm" margin-left="10mm" margin-right="10mm" margin-bottom="20mm" />
      <fo:region-before display-align="after" region-name="header" extent="25mm" />
      <fo:region-after region-name="footer" extent="15mm" />
      <fo:region-start extent="8mm" />
      <fo:region-end extent="8mm" />
    </fo:simple-page-master>
  </fo:layout-master-set>
  
  <fo:page-sequence master-reference="pageMaster">
    <fo:flow flow-name="xsl-region-body">
      <fo:block>EAN-128</fo:block>
      <fo:block>
        <fo:instream-foreign-object>
          <barcode xmlns="http://barcode4j.krysalis.org/ns" message="9176643219876543210987654321098765432109178">
            <ean-128>
              <height>15mm</height>
              <module-width>0.21mm</module-width>
              <template>(91)n41+cd0</template>
              <human-readable>
                <pattern>__________-____________________________-_-______-_</pattern>
              </human-readable>
            </ean-128>
          </barcode>
        </fo:instream-foreign-object>
      </fo:block>
    </fo:flow>
  </fo:page-sequence>
</fo:root>

図 2.PDFバーコード付きPDF(クリックするとPDFを表示します。)

参照
FOP add-ons
http://xmlgraphics.apache.org/fop/resources.html#products-fop-add-ons
Instructions for the Apache FOP extension
http://barcode4j.sourceforge.net/2.1/fop-ext.html

©中條勝徳 and okulejp.com, 2012.

okule による Barcode4J, FOP, XML への投稿 (7月 22, 2012)

タグ: , , ,

DB2 Express-C 10.1 pureXML 実行計画の変更点   Leave a comment

Figure 1.実行計画 DB2 v9.7.5
explan

Figure 2.実行計画 DB2 v10.1.0
explan

DB2 Express-C 9.7.5では、fn:starts-withを使用した場合、pureXML専用のインデックススキャンであるXISCANは使用されてなかったが、DB2 Express-C 10.1.0では使用されるようになった。前方検索するときに、XISCANが実行されることを強く望んでいたので、大変喜ばしいことである。理由は、当然インデックス索引を使用されないと、100万レコードみたいな大量のXML文書の検索のときに時間がとてもかかるからである。

Figure 3. SQL

SELECT * FROM OKULE.CLIENTS
WHERE xmlexists(
  '$c//phone/*[fn:starts-with(.,"5" )]' 
  passing OKULE.CLIENTS.CONTACT AS "c" 
)

©中條勝徳 and okulejp.com, 2012.

okule による DB2, pureXML, XML, XQuery への投稿 (7月 18, 2012)

タグ: , , ,