001/* 002 * Copyright (c) 2009 The openGion Project. 003 * 004 * Licensed under the Apache License, Version 2.0 (the "License"); 005 * you may not use this file except in compliance with the License. 006 * You may obtain a copy of the License at 007 * 008 * http://www.apache.org/licenses/LICENSE-2.0 009 * 010 * Unless required by applicable law or agreed to in writing, software 011 * distributed under the License is distributed on an "AS IS" BASIS, 012 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, 013 * either express or implied. See the License for the specific language 014 * governing permissions and limitations under the License. 015 */ 016package org.opengion.fukurou.model; 017 018import java.io.BufferedReader; 019import java.io.File; 020import java.io.IOException; 021import java.nio.charset.CharacterCodingException; // 6.3.1.0 (2015/06/28) 022 023import org.opengion.fukurou.system.OgRuntimeException ; // 6.4.2.0 (2016/01/29) 024import org.opengion.fukurou.system.OgCharacterException ; // 6.5.0.1 (2016/10/21) 025import org.opengion.fukurou.util.StringUtil; 026import org.opengion.fukurou.util.FileUtil; 027// import org.opengion.fukurou.system.Closer; // 8.5.4.2 (2024/01/12) PMD 7.0.0 CloseResource 対応 028import static org.opengion.fukurou.system.HybsConst.CR; 029import static org.opengion.fukurou.system.HybsConst.BUFFER_MIDDLE; 030 031/** 032 * 指定の区切り記号(初期値:タブ区切り)ファイルの読み取りクラスです。 033 * 034 * txt形式のテキストファイルを、イベント方式でテキストデータを読み取ります。 035 * タブ区切りテキストファイルで、セパレータと文字コードを外部から指定できます。 036 * 037 * @og.rev 6.2.0.0 (2015/02/27) 新規追加 038 * @og.group ファイル入力 039 * 040 * @version 6.0 041 * @author Kazuhiko Hasegawa 042 * @since JDK6.0, 043 */ 044public class EventReader_TEXT implements EventReader { 045 /** このプログラムのVERSION文字列を設定します。 {@value} */ 046 private static final String VERSION = "8.5.4.2 (2024/01/12)" ; 047 048 private String separator = "\t"; // 項目区切り文字 049 private String encode = "UTF-8"; // Shift_JIS,MS932,Windows-31J,UTF-8,ISO-8859-1,UnicodeLittle・・・ 050 051 /** 052 * デフォルトコンストラクター 053 * 054 * @og.rev 6.4.2.0 (2016/01/29) PMD refactoring. Each class should declare at least one constructor. 055 */ 056 public EventReader_TEXT() { super(); } // これも、自動的に呼ばれるが、空のメソッドを作成すると警告されるので、明示的にしておきます。 057 058 /** 059 * 引数ファイル(Text)を、イベントモデルを使用してテキスト化します。 060 * 061 * TableModelHelperは、EXCEL/TEXT読み取り処理用の統一されたイベント処理クラスです。 062 * openGion特有のEXCEL/TEXT処理方法(#NAME , 先頭行#コメントなど)を実装しています。 063 * これは、EXCELやTEXTの処理を、統一的なイベントモデルで扱うためです。 064 * あくまで、読み取り限定であれば、こちらのイベントモデルで十分です。 065 * 066 * @og.rev 6.2.0.0 (2015/02/27) 新規作成 067 * @og.rev 6.3.1.0 (2015/06/28) nioを使用すると UTF-8とShuft-JISで、エラーになる。 068 * @og.rev 6.5.0.1 (2016/10/21) CharacterCodingException は、OgCharacterException に変換する。 069 * @og.rev 8.5.4.2 (2024/01/12) PMD 7.0.0 CloseResource 対応 070 * 071 * @param file 入力ファイル 072 * @param helper イベント処理するオブジェクト 073 */ 074 @Override // EventReader 075 public void eventReader( final File file , final TableModelHelper helper ) { 076 // 8.5.4.2 (2024/01/12) PMD 7.0.0 CloseResource 対応 077// BufferedReader reader = null ; 078// try { 079 try ( BufferedReader reader = FileUtil.getBufferedReader( file,encode ) ) { 080 helper.startFile( file ); 081 082// // 6.2.0.0 (2015/02/27) TableModelHelper 変更に伴う修正 083// reader = FileUtil.getBufferedReader( file,encode ); 084 085 String line; 086 int rowNo = 0; 087 final char sepa = separator.charAt(0); 088 089 final StringBuilder buf = new StringBuilder( BUFFER_MIDDLE ); 090 while((line = reader.readLine()) != null) { 091 if( helper.isSkip( rowNo ) ) { break; } 092 093 // 5.2.0.0 (2010/09/01) ""で囲われているデータに改行が入っていた場合の対応 094 int quotCount = StringUtil.countChar( line, '"' ); 095 if( quotCount % 2 != 0 ) { 096 String addLine = null; 097 buf.setLength(0); 098 buf.append( line ); 099 while(quotCount % 2 != 0 && (addLine = reader.readLine()) != null) { 100 buf.append( CR ).append( addLine ); 101 quotCount += StringUtil.countChar( addLine, '"' ); 102 } 103 line = buf.toString(); 104 } 105 helper.value( line, rowNo++, sepa ); 106 // // オーバーフロー時は、HybsOverflowException が throw される。 107 // if( helper.isOverflow() ) { break; } // オーバーフローで打ち切り 108 } 109 } 110 // 6.3.1.0 (2015/06/28) nioを使用すると UTF-8とShuft-JISで、エラーになる。 111 catch( final CharacterCodingException ex ) { 112 final String errMsg = "文字のエンコード・エラーが発生しました。" + CR 113 + " ファイルのエンコードが指定のエンコードと異なります。" + CR 114 + " [" + file.getPath() + "] , Encode=[" + encode + "]" ; 115 throw new OgCharacterException( errMsg,ex ); // 6.5.0.1 (2016/10/21) 116 } 117 catch( final IOException ex ) { 118 final String errMsg = "ファイル読込みエラーが発生しました。" + CR 119 + " [" + file.getPath() + "] , Encode=[" + encode + "]" ; 120 throw new OgRuntimeException( errMsg,ex ); 121 } 122 finally { 123// Closer.ioClose( reader ); 124 helper.endFile( file ); // 6.2.0.0 (2015/02/27) 125 } 126 } 127 128 /** 129 * データを読み込む場合の区切り文字をセットします。 130 * 131 * なお、このメソッドは、サブクラスによっては使用しない場合があります。 132 * もし、使用しないサブクラスを作成する場合は、UnsupportedOperationException 133 * を throw するようにサブクラスで実装して下さい。 134 * 135 * @param sep 区切り文字 136 */ 137 public void setSeparator( final String sep ) { 138 if( sep != null ) { separator = sep; } 139 } 140 141 /** 142 * 読み取り元ファイルのエンコード文字列を指定します。 143 * ファイルは、BufferedReader で受け取る為、本来は、エンコードは不要ですが、 144 * 固定長ファイルの読み取り時のバイトコード分割時に、指定のエンコードで 145 * 分割する必要があります。(例えば、半角文字は、Shift_JIS では、1バイト) 146 * 147 * @param enc ファイルのエンコード文字列 148 */ 149 public void setEncode( final String enc ) { 150 encode = enc; 151 } 152}