はじめに
この記事を読めばJavaのsubstringメソッドをマスターすることができるようになります。
文字列操作はプログラミングにおいて非常に一般的なタスクです。
特にJavaにおいては、多くのAPIやライブラリが文字列を活用しています。
そこで今回は、Javaのsubstring
メソッドに焦点を当て、その使い方から応用例、注意点までを徹底的に解説します。
コードを書いていると、「この部分だけ切り出したいな」と思うことがよくありますよね。
そんな時に非常に便利なのが、このsubstring
メソッドです。
●Javaとsubstringメソッドとは
○Java言語の概要
Javaは、1990年代にSun Microsystems(現在はOracle Corporationが所有)によって開発されたプログラミング言語です。
特にウェブアプリケーションやAndroidアプリケーションなど、多岐にわたる場面で使用されています。
Javaが提供する標準ライブラリには、数多くの便利なメソッドやクラスがあり、その一つがString
クラスとそのメソッドであるsubstring
です。
○substringメソッドの基本
substring
メソッドは、String
クラスの一部として提供されており、文字列から指定した範囲の部分文字列を取得することができます。
具体的には、substring(int beginIndex, int endIndex)
という形で使用します。
beginIndex
は部分文字列が始まる位置(0から始まるインデックス)、endIndex
は部分文字列が終わる位置です(この位置の文字は含まれません)。
このコードを実行すると、Hello
という部分文字列が出力されます。
この例では、元の文字列Hello, World!
から0番目から5番目(5番目は含まれない)までの文字列を切り出しています。
●substringメソッドの使い方
substringメソッドの基本的な使い方を把握したところで、さまざまな使い方とその詳細について解説していきます。
コード例を交えて、初心者にもわかるように細かく説明していくので、最後まで読んでいただければ、substringメソッドの多様な使い方が身に付くでしょう。
○サンプルコード1:基本的なsubstringの使い方
まずは一番簡単な例から見ていきましょう。
このコードでは、”JavaProgramming”という文字列からインデックス4から6までの部分文字列を取得しています。
つまり、取得される文字列は”Prog”です。
コードを実行すると、実際に”Prog”と出力されることを確認できます。
○サンプルコード2:文字列の途中から取得する方法
次に、文字列の途中から末尾まで取得する方法です。
このコードでは、substring(4)
とした場合、インデックス4から最後までの文字列が取得されます。
この場合は”Programming”となります。確認すると、出力も”Programming”となることがわかります。
○サンプルコード3:特定の位置からの取得
最後に、特定の位置、例えば文字列の中の特定の文字から部分文字列を取得する方法を見てみましょう。
このコードでは、indexOf
メソッドを使って”Pro”という文字列が始まる位置を探し、その位置を基にsubstring
メソッドを使っています。
具体的には、”Pro”が始まる位置をindex
とし、index
からindex + 3
までの部分文字列を取得しています。
この場合、取得される部分文字列は”Pro”となります。出力も”Pro”となることが確認できます。
●substringメソッドの応用例
基本的な使い方を一通り解説した後、さらに踏み込んでsubstringメソッドの応用例についても説明していきます。
ここで解説するテクニックを駆使することで、substringメソッドの可能性をさらに広げられるでしょう。
○サンプルコード4:特定の文字を基に部分文字列を取得
substring
メソッドとindexOf
メソッドを組み合わせることで、特定の文字を基準に部分文字列を取得することが可能です。
このコードではindexOf
メソッドで”-“(ハイフン)が現れる最初の位置を調べ、その位置までの文字列をsubstring
メソッドで取得しています。
この例では出力結果は”Java”となります。
○サンプルコード5:文字列の変換と組み合わせて使用
文字列を大文字や小文字に変換した後でsubstring
メソッドを使用することもあります。
このコードでは、まずtoUpperCase
メソッドで文字列を全て大文字に変換してから、その後でsubstring
メソッドを使っています。
この例ではインデックス4から5までの部分文字列”IS”が出力されます。
○サンプルコード6:複数の部分文字列を取得
Javaのsubstringメソッドを使って、複数の部分文字列を一度に取得するケースもよくあります。
これはたとえば、特定の形式に従った文字列からデータを抽出する場合などに役立ちます。
このコードでは、日付の文字列"2022-09-24"
から年、月、日を取り出しています。
そのために、substring
メソッドを3回連続で使用しています。
年は0から4文字目まで、月は5から7文字目まで、日は8から10文字目まで取得しています。
実行結果は、”年: 2022″、”月: 09″、”日: 24″がそれぞれ出力されます。
○サンプルコード7:正規表現との組み合わせ
正規表現とsubstringメソッドを組み合わせることで、より高度な文字列操作が可能になります。
下記の例では、正規表現を使用して文字列内にある数字だけを抽出し、その後でsubstringメソッドを用いて特定の数字を取得しています。
このコードでは、まずPattern
とMatcher
クラスを使用して、文字列から数字部分を抽出します。
その後、substring
とindexOf
メソッドを使って、抽出した金額からドルの部分(”.”より前の部分)を取り出しています。
この例では出力結果が”ドル部分: 25″になります。
○サンプルコード8:大文字・小文字の変換との組み合わせ
Javaにおけるsubstringメソッドは、文字列操作における多くのケースで利用可能です。
特に、文字列内の部分的な大文字・小文字変換と組み合わせることで、柔軟かつ効率的なコードを実現することができます。
このJavaのコード例では、sentence
という変数に格納された”hello world”という文字列の各単語を大文字に変換しています。
具体的には、substring
メソッドで"hello"
と"world"
をそれぞれ切り出し、その後toUpperCase()
メソッドを使って大文字に変換しています。
この結果として出力される文字列は”HELLO WORLD”です。
○サンプルコード9:trimメソッドとの連携
substring
メソッドとtrim
メソッドを組み合わせることで、余分なスペースがある場合でも期待する部分文字列を取得できます。
このJavaのコード例では、text
という変数に格納された” Java Programming “という文字列から"Programmi"
という部分文字列を取得しています。
この場合、先にtrim
メソッドで文字列の両端の余分なスペースを取り除き、その後でsubstring
メソッドを使用して目的の部分文字列を取得しています。
この手法により、期待通りの部分文字列を安定して取得できます。
○サンプルコード10:配列やリストとの連携
Javaでsubstring
メソッドを使う際には、配列やリストとも連携させることが多々あります。
この連携によって、文字列から特定の部分を抽出し、それを配列やリストに格納するなどの高度な操作が可能になります。
まず、配列とsubstring
メソッドを組み合わせて使用する一例として、次のサンプルコードをご覧ください。
このコード例では、カンマで区切られた文字列str
からsplit
メソッドを用いて配列fruits
を作成しています。
その後、forループ内でsubstring
メソッドを利用して各要素(フルーツ名)の最初の文字だけを大文字に変換しています。
出力結果として、「Apple」「Banana」「Cherry」という単語が順に表示されます。
次に、JavaのArrayListとsubstring
メソッドとの連携について見ていきます。
このコードでは、文字列sentence
から単語を抽出し、それをArrayListのwords
に追加しています。
具体的には、substring
メソッドを使用して、スペースで区切られた各単語を取り出しています。
このプログラムを実行すると、”ArrayListの内容: [I, love, Java]”という結果が得られます。
●substringメソッドの注意点と対処法
substringメソッドは多くの場面で有用ですが、注意すべき点もいくつかあります。
ここでは、よくあるトラブルとその対処法を詳しく解説していきます。
○文字列の範囲外へのアクセス
まず最初に、文字列の範囲外へアクセスする場合の注意点についてです。
これは、substringメソッドで指定した開始位置や終了位置が、元の文字列の長さを超えている場合に発生します。
このコードでは、"hello"
という5文字の文字列から、3番目から10番目までの部分文字列を取得しようとしています。
しかし、文字列は5文字しかないので、この操作はStringIndexOutOfBoundsException
という例外を発生させます。
実行して例外が発生すると、catchブロックが実行され「文字列の範囲外にアクセスしました」というメッセージが出力されます。
この問題を避けるためには、substring
メソッドを呼び出す前に、文字列の長さを確認することが重要です。
String.length()
メソッドを使用して、取得しようとする部分文字列が元の文字列の範囲内に収まることを確認してからsubstring
メソッドを呼び出しましょう。
○負の開始位置や終了位置の取り扱い
次に、substring
メソッドで負の開始位置や終了位置を指定した場合の動きについて解説します。
このサンプルコードでは、負の数値-1
を開始位置として指定しています。
その結果、StringIndexOutOfBoundsException
例外が発生します。
実行すると、例外が発生すると、catchブロックが実行され、「負の位置を指定しました」というメッセージが出力されます。
対処法として、負の値が使われないよう、開始位置と終了位置を厳密にチェックすることが重要です。
負の値が指定された場合は、プログラムの処理を中断するか、適切なエラーメッセージを表示するように設計することが求められます。
○特殊文字や全角文字の取扱い
最後に、特殊文字や全角文字を扱う場面での注意点について解説します。
substring
メソッドは、UTF-16でエンコードされた文字列を対象としています。
このため、全角文字や特殊文字が含まれる場合には、慎重な取り扱いが必要です。
このコードを実行すると、「部分文字列: こん」が出力されますが、これは一般的な文字と全角文字が混在する場合でも同様です。
対処法として、特殊文字や全角文字を含む場合は、そのエンコーディングに適したメソッドを使用するか、事前に文字列を正規化してからsubstring
メソッドを適用することをおすすめします。
●カスタマイズ方法
Javaのsubstringメソッドは非常に便利な機能ですが、時には基本的な操作だけでは足りない場合もあります。
そのような状況で有用なのがカスタマイズ方法です。
ここでは、substringメソッドのカスタマイズについて、具体的な方法とサンプルコードを交えて解説します。
○外部ライブラリを使った拡張
Javaには多くの外部ライブラリが存在し、その中には文字列操作をより柔軟に、かつ効率的に行うためのライブラリもあります。
例としてApache Commons Langというライブラリがあります。
このコードではApache Commons LangのStringUtils.substring
メソッドを使用して、部分文字列を取得しています。
指定した範囲内で部分文字列を正確に取得することができます。
コードを実行すると、"取得した部分文字列: cde"
と出力されます。
この結果からもわかるように、指定した範囲で部分文字列を正確に取得できました。
対処として、外部ライブラリを使用する際には、まず該当するライブラリをプロジェクトにインポートする必要があります。
MavenやGradleなどの依存関係管理ツールを用いて、簡単にライブラリを追加できます。
○substringメソッドをオーバーライドする方法
一般的なsubstringメソッドの機能では不足と感じる場面があれば、自分自身で新たなメソッドを作成することも可能です。
このコードでは、独自のcustomSubstring
メソッドを定義しています。
このメソッドは、Javaの標準substring
メソッドに、文字列が短い場合に末尾を指定のfiller
で埋める機能を追加しています。
このコードを実行すると、"取得した部分文字列: プログラミ"
が出力されます。
指定した開始位置と終了位置に従い、かつ不足する長さをfiller
で埋めて部分文字列を取得することができました。
まとめ
Javaのsubstringメソッドについて、基本的な使い方から応用例、さらには注意点とその対処法、カスタマイズ方法に至るまで詳しく解説してきました。
この記事を通して、Javaプログラミングにおける文字列操作の幅が広がったことを願っています。
この情報がJavaプログラミング、特に文字列操作の一環として役立つことを心より願っています。
今後もJavaに関するさまざまなテーマで情報を発信していく予定ですので、ぜひチェックしてみてください。