001/*
002 * Copyright (c) 2009 The openGion Project.
003 *
004 * Licensed under the Apache License, Version 2.0 (the "License");
005 * you may not use this file except in compliance with the License.
006 * You may obtain a copy of the License at
007 *
008 *     http://www.apache.org/licenses/LICENSE-2.0
009 *
010 * Unless required by applicable law or agreed to in writing, software
011 * distributed under the License is distributed on an "AS IS" BASIS,
012 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND,
013 * either express or implied. See the License for the specific language
014 * governing permissions and limitations under the License.
015 */
016package org.opengion.fukurou.model;
017
018import java.io.BufferedReader;
019import java.io.File;
020import java.io.IOException;
021import java.nio.charset.CharacterCodingException;                                       // 6.3.1.0 (2015/06/28)
022
023import org.opengion.fukurou.system.OgRuntimeException ;                         // 6.4.2.0 (2016/01/29)
024import org.opengion.fukurou.system.OgCharacterException ;                       // 6.5.0.1 (2016/10/21)
025import org.opengion.fukurou.util.StringUtil;
026import org.opengion.fukurou.util.FileUtil;
027// import org.opengion.fukurou.system.Closer;                                           // 8.5.4.2 (2024/01/12) PMD 7.0.0 CloseResource 対応
028import static org.opengion.fukurou.system.HybsConst.CR;
029import static org.opengion.fukurou.system.HybsConst.BUFFER_MIDDLE;
030
031/**
032 * 指定の区切り記号(初期値:タブ区切り)ファイルの読み取りクラスです。
033 *
034 * txt形式のテキストファイルを、イベント方式でテキストデータを読み取ります。
035 * タブ区切りテキストファイルで、セパレータと文字コードを外部から指定できます。
036 *
037 * @og.rev 6.2.0.0 (2015/02/27) 新規追加
038 * @og.group ファイル入力
039 *
040 * @version  6.0
041 * @author   Kazuhiko Hasegawa
042 * @since    JDK6.0,
043 */
044public class EventReader_TEXT implements EventReader {
045        /** このプログラムのVERSION文字列を設定します。   {@value} */
046        private static final String VERSION = "8.5.4.2 (2024/01/12)" ;
047
048        private String  separator       = "\t";                 // 項目区切り文字
049        private String  encode          = "UTF-8";              // Shift_JIS,MS932,Windows-31J,UTF-8,ISO-8859-1,UnicodeLittle・・・
050
051        /**
052         * デフォルトコンストラクター
053         *
054         * @og.rev 6.4.2.0 (2016/01/29) PMD refactoring. Each class should declare at least one constructor.
055         */
056        public EventReader_TEXT() { super(); }          // これも、自動的に呼ばれるが、空のメソッドを作成すると警告されるので、明示的にしておきます。
057
058        /**
059         * 引数ファイル(Text)を、イベントモデルを使用してテキスト化します。
060         *
061         * TableModelHelperは、EXCEL/TEXT読み取り処理用の統一されたイベント処理クラスです。
062         * openGion特有のEXCEL/TEXT処理方法(#NAME , 先頭行#コメントなど)を実装しています。
063         * これは、EXCELやTEXTの処理を、統一的なイベントモデルで扱うためです。
064         * あくまで、読み取り限定であれば、こちらのイベントモデルで十分です。
065         *
066         * @og.rev 6.2.0.0 (2015/02/27) 新規作成
067         * @og.rev 6.3.1.0 (2015/06/28) nioを使用すると UTF-8とShuft-JISで、エラーになる。
068         * @og.rev 6.5.0.1 (2016/10/21) CharacterCodingException は、OgCharacterException に変換する。
069         * @og.rev 8.5.4.2 (2024/01/12) PMD 7.0.0 CloseResource 対応
070         *
071         * @param       file 入力ファイル
072         * @param       helper イベント処理するオブジェクト
073         */
074        @Override       // EventReader
075        public void eventReader( final File file , final TableModelHelper helper ) {
076                // 8.5.4.2 (2024/01/12) PMD 7.0.0 CloseResource 対応
077//              BufferedReader  reader  = null ;
078//              try {
079                try ( BufferedReader reader = FileUtil.getBufferedReader( file,encode ) ) {
080                        helper.startFile( file );
081
082//                      // 6.2.0.0 (2015/02/27) TableModelHelper 変更に伴う修正
083//                      reader = FileUtil.getBufferedReader( file,encode );
084
085                        String line;
086                        int rowNo = 0;
087                        final char sepa = separator.charAt(0);
088
089                        final StringBuilder buf = new StringBuilder( BUFFER_MIDDLE );
090                        while((line = reader.readLine()) != null) {
091                                if( helper.isSkip( rowNo ) ) { break; }
092
093                                // 5.2.0.0 (2010/09/01) ""で囲われているデータに改行が入っていた場合の対応
094                                int quotCount = StringUtil.countChar( line, '"' );
095                                if( quotCount % 2 != 0 ) {
096                                        String addLine = null;
097                                        buf.setLength(0);
098                                        buf.append( line );
099                                        while(quotCount % 2 != 0 && (addLine = reader.readLine()) != null) {
100                                                buf.append( CR ).append( addLine );
101                                                quotCount += StringUtil.countChar( addLine, '"' );
102                                        }
103                                        line = buf.toString();
104                                }
105                                helper.value( line, rowNo++, sepa );
106        //                      // オーバーフロー時は、HybsOverflowException が throw される。
107        //                      if( helper.isOverflow() ) { break; }            // オーバーフローで打ち切り
108                        }
109                }
110                // 6.3.1.0 (2015/06/28) nioを使用すると UTF-8とShuft-JISで、エラーになる。
111                catch( final CharacterCodingException ex ) {
112                        final String errMsg = "文字のエンコード・エラーが発生しました。" + CR
113                                                                +       "  ファイルのエンコードが指定のエンコードと異なります。" + CR
114                                                                +       " [" + file.getPath() + "] , Encode=[" + encode + "]" ;
115                        throw new OgCharacterException( errMsg,ex );    // 6.5.0.1 (2016/10/21)
116                }
117                catch( final IOException ex ) {
118                        final String errMsg = "ファイル読込みエラーが発生しました。" + CR
119                                                                +       " [" + file.getPath() + "] , Encode=[" + encode + "]" ;
120                        throw new OgRuntimeException( errMsg,ex );
121                }
122                finally {
123//                      Closer.ioClose( reader );
124                        helper.endFile( file );                                 // 6.2.0.0 (2015/02/27)
125                }
126        }
127
128        /**
129         * データを読み込む場合の区切り文字をセットします。
130         *
131         * なお、このメソッドは、サブクラスによっては使用しない場合があります。
132         * もし、使用しないサブクラスを作成する場合は、UnsupportedOperationException
133         * を throw するようにサブクラスで実装して下さい。
134         *
135         * @param   sep 区切り文字
136         */
137        public void setSeparator( final String sep ) {
138                if( sep != null ) { separator = sep; }
139        }
140
141        /**
142         * 読み取り元ファイルのエンコード文字列を指定します。
143         * ファイルは、BufferedReader で受け取る為、本来は、エンコードは不要ですが、
144         * 固定長ファイルの読み取り時のバイトコード分割時に、指定のエンコードで
145         * 分割する必要があります。(例えば、半角文字は、Shift_JIS では、1バイト)
146         *
147         * @param   enc ファイルのエンコード文字列
148         */
149        public void setEncode( final String enc ) {
150                encode = enc;
151        }
152}