xref: /aoo4110/main/sal/textenc/converteuctw.c (revision b1cdbd2c)
1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski #include "converteuctw.h"
25*b1cdbd2cSJim Jagielski #include "context.h"
26*b1cdbd2cSJim Jagielski #include "converter.h"
27*b1cdbd2cSJim Jagielski #include "tenchelp.h"
28*b1cdbd2cSJim Jagielski #include "unichars.h"
29*b1cdbd2cSJim Jagielski #include "rtl/alloc.h"
30*b1cdbd2cSJim Jagielski #include "rtl/textcvt.h"
31*b1cdbd2cSJim Jagielski #include "sal/types.h"
32*b1cdbd2cSJim Jagielski 
33*b1cdbd2cSJim Jagielski typedef enum
34*b1cdbd2cSJim Jagielski {
35*b1cdbd2cSJim Jagielski     IMPL_EUC_TW_TO_UNICODE_STATE_0,
36*b1cdbd2cSJim Jagielski     IMPL_EUC_TW_TO_UNICODE_STATE_1,
37*b1cdbd2cSJim Jagielski     IMPL_EUC_TW_TO_UNICODE_STATE_2_1,
38*b1cdbd2cSJim Jagielski     IMPL_EUC_TW_TO_UNICODE_STATE_2_2,
39*b1cdbd2cSJim Jagielski     IMPL_EUC_TW_TO_UNICODE_STATE_2_3
40*b1cdbd2cSJim Jagielski } ImplEucTwToUnicodeState;
41*b1cdbd2cSJim Jagielski 
42*b1cdbd2cSJim Jagielski typedef struct
43*b1cdbd2cSJim Jagielski {
44*b1cdbd2cSJim Jagielski     ImplEucTwToUnicodeState m_eState;
45*b1cdbd2cSJim Jagielski     sal_Int32 m_nPlane; /* 0--15 */
46*b1cdbd2cSJim Jagielski     sal_Int32 m_nRow; /* 0--93 */
47*b1cdbd2cSJim Jagielski } ImplEucTwToUnicodeContext;
48*b1cdbd2cSJim Jagielski 
ImplCreateEucTwToUnicodeContext(void)49*b1cdbd2cSJim Jagielski void * ImplCreateEucTwToUnicodeContext(void)
50*b1cdbd2cSJim Jagielski {
51*b1cdbd2cSJim Jagielski     void * pContext = rtl_allocateMemory(sizeof (ImplEucTwToUnicodeContext));
52*b1cdbd2cSJim Jagielski     ((ImplEucTwToUnicodeContext *) pContext)->m_eState
53*b1cdbd2cSJim Jagielski         = IMPL_EUC_TW_TO_UNICODE_STATE_0;
54*b1cdbd2cSJim Jagielski     return pContext;
55*b1cdbd2cSJim Jagielski }
56*b1cdbd2cSJim Jagielski 
ImplResetEucTwToUnicodeContext(void * pContext)57*b1cdbd2cSJim Jagielski void ImplResetEucTwToUnicodeContext(void * pContext)
58*b1cdbd2cSJim Jagielski {
59*b1cdbd2cSJim Jagielski     if (pContext)
60*b1cdbd2cSJim Jagielski         ((ImplEucTwToUnicodeContext *) pContext)->m_eState
61*b1cdbd2cSJim Jagielski             = IMPL_EUC_TW_TO_UNICODE_STATE_0;
62*b1cdbd2cSJim Jagielski }
63*b1cdbd2cSJim Jagielski 
ImplConvertEucTwToUnicode(ImplTextConverterData const * pData,void * pContext,sal_Char const * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)64*b1cdbd2cSJim Jagielski sal_Size ImplConvertEucTwToUnicode(ImplTextConverterData const * pData,
65*b1cdbd2cSJim Jagielski                                    void * pContext,
66*b1cdbd2cSJim Jagielski                                    sal_Char const * pSrcBuf,
67*b1cdbd2cSJim Jagielski                                    sal_Size nSrcBytes,
68*b1cdbd2cSJim Jagielski                                    sal_Unicode * pDestBuf,
69*b1cdbd2cSJim Jagielski                                    sal_Size nDestChars,
70*b1cdbd2cSJim Jagielski                                    sal_uInt32 nFlags,
71*b1cdbd2cSJim Jagielski                                    sal_uInt32 * pInfo,
72*b1cdbd2cSJim Jagielski                                    sal_Size * pSrcCvtBytes)
73*b1cdbd2cSJim Jagielski {
74*b1cdbd2cSJim Jagielski     sal_uInt16 const * pCns116431992Data
75*b1cdbd2cSJim Jagielski         = ((ImplEucTwConverterData const *) pData)->
76*b1cdbd2cSJim Jagielski               m_pCns116431992ToUnicodeData;
77*b1cdbd2cSJim Jagielski     sal_Int32 const * pCns116431992RowOffsets
78*b1cdbd2cSJim Jagielski         = ((ImplEucTwConverterData const *) pData)->
79*b1cdbd2cSJim Jagielski               m_pCns116431992ToUnicodeRowOffsets;
80*b1cdbd2cSJim Jagielski     sal_Int32 const * pCns116431992PlaneOffsets
81*b1cdbd2cSJim Jagielski         = ((ImplEucTwConverterData const *) pData)->
82*b1cdbd2cSJim Jagielski               m_pCns116431992ToUnicodePlaneOffsets;
83*b1cdbd2cSJim Jagielski     ImplEucTwToUnicodeState eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
84*b1cdbd2cSJim Jagielski     sal_Int32 nPlane = 0;
85*b1cdbd2cSJim Jagielski     sal_Int32 nRow = 0;
86*b1cdbd2cSJim Jagielski     sal_uInt32 nInfo = 0;
87*b1cdbd2cSJim Jagielski     sal_Size nConverted = 0;
88*b1cdbd2cSJim Jagielski     sal_Unicode * pDestBufPtr = pDestBuf;
89*b1cdbd2cSJim Jagielski     sal_Unicode * pDestBufEnd = pDestBuf + nDestChars;
90*b1cdbd2cSJim Jagielski 
91*b1cdbd2cSJim Jagielski     if (pContext)
92*b1cdbd2cSJim Jagielski     {
93*b1cdbd2cSJim Jagielski         eState = ((ImplEucTwToUnicodeContext *) pContext)->m_eState;
94*b1cdbd2cSJim Jagielski         nPlane = ((ImplEucTwToUnicodeContext *) pContext)->m_nPlane;
95*b1cdbd2cSJim Jagielski         nRow = ((ImplEucTwToUnicodeContext *) pContext)->m_nRow;
96*b1cdbd2cSJim Jagielski     }
97*b1cdbd2cSJim Jagielski 
98*b1cdbd2cSJim Jagielski     for (; nConverted < nSrcBytes; ++nConverted)
99*b1cdbd2cSJim Jagielski     {
100*b1cdbd2cSJim Jagielski         sal_Bool bUndefined = sal_True;
101*b1cdbd2cSJim Jagielski         sal_uInt32 nChar = *(sal_uChar const *) pSrcBuf++;
102*b1cdbd2cSJim Jagielski         switch (eState)
103*b1cdbd2cSJim Jagielski         {
104*b1cdbd2cSJim Jagielski         case IMPL_EUC_TW_TO_UNICODE_STATE_0:
105*b1cdbd2cSJim Jagielski             if (nChar < 0x80)
106*b1cdbd2cSJim Jagielski                 if (pDestBufPtr != pDestBufEnd)
107*b1cdbd2cSJim Jagielski                     *pDestBufPtr++ = (sal_Unicode) nChar;
108*b1cdbd2cSJim Jagielski                 else
109*b1cdbd2cSJim Jagielski                     goto no_output;
110*b1cdbd2cSJim Jagielski             else if (nChar >= 0xA1 && nChar <= 0xFE)
111*b1cdbd2cSJim Jagielski             {
112*b1cdbd2cSJim Jagielski                 nRow = nChar - 0xA1;
113*b1cdbd2cSJim Jagielski                 eState = IMPL_EUC_TW_TO_UNICODE_STATE_1;
114*b1cdbd2cSJim Jagielski             }
115*b1cdbd2cSJim Jagielski             else if (nChar == 0x8E)
116*b1cdbd2cSJim Jagielski                 eState = IMPL_EUC_TW_TO_UNICODE_STATE_2_1;
117*b1cdbd2cSJim Jagielski             else
118*b1cdbd2cSJim Jagielski             {
119*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
120*b1cdbd2cSJim Jagielski                 goto bad_input;
121*b1cdbd2cSJim Jagielski             }
122*b1cdbd2cSJim Jagielski             break;
123*b1cdbd2cSJim Jagielski 
124*b1cdbd2cSJim Jagielski         case IMPL_EUC_TW_TO_UNICODE_STATE_1:
125*b1cdbd2cSJim Jagielski             if (nChar >= 0xA1 && nChar <= 0xFE)
126*b1cdbd2cSJim Jagielski             {
127*b1cdbd2cSJim Jagielski                 nPlane = 0;
128*b1cdbd2cSJim Jagielski                 goto transform;
129*b1cdbd2cSJim Jagielski             }
130*b1cdbd2cSJim Jagielski             else
131*b1cdbd2cSJim Jagielski             {
132*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
133*b1cdbd2cSJim Jagielski                 goto bad_input;
134*b1cdbd2cSJim Jagielski             }
135*b1cdbd2cSJim Jagielski             break;
136*b1cdbd2cSJim Jagielski 
137*b1cdbd2cSJim Jagielski         case IMPL_EUC_TW_TO_UNICODE_STATE_2_1:
138*b1cdbd2cSJim Jagielski             if (nChar >= 0xA1 && nChar <= 0xB0)
139*b1cdbd2cSJim Jagielski             {
140*b1cdbd2cSJim Jagielski                 nPlane = nChar - 0xA1;
141*b1cdbd2cSJim Jagielski                 ++eState;
142*b1cdbd2cSJim Jagielski             }
143*b1cdbd2cSJim Jagielski             else
144*b1cdbd2cSJim Jagielski             {
145*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
146*b1cdbd2cSJim Jagielski                 goto bad_input;
147*b1cdbd2cSJim Jagielski             }
148*b1cdbd2cSJim Jagielski             break;
149*b1cdbd2cSJim Jagielski 
150*b1cdbd2cSJim Jagielski         case IMPL_EUC_TW_TO_UNICODE_STATE_2_2:
151*b1cdbd2cSJim Jagielski             if (nChar >= 0xA1 && nChar <= 0xFE)
152*b1cdbd2cSJim Jagielski             {
153*b1cdbd2cSJim Jagielski                 nRow = nChar - 0xA1;
154*b1cdbd2cSJim Jagielski                 ++eState;
155*b1cdbd2cSJim Jagielski             }
156*b1cdbd2cSJim Jagielski             else
157*b1cdbd2cSJim Jagielski             {
158*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
159*b1cdbd2cSJim Jagielski                 goto bad_input;
160*b1cdbd2cSJim Jagielski             }
161*b1cdbd2cSJim Jagielski             break;
162*b1cdbd2cSJim Jagielski 
163*b1cdbd2cSJim Jagielski         case IMPL_EUC_TW_TO_UNICODE_STATE_2_3:
164*b1cdbd2cSJim Jagielski             if (nChar >= 0xA1 && nChar <= 0xFE)
165*b1cdbd2cSJim Jagielski                 goto transform;
166*b1cdbd2cSJim Jagielski             else
167*b1cdbd2cSJim Jagielski             {
168*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
169*b1cdbd2cSJim Jagielski                 goto bad_input;
170*b1cdbd2cSJim Jagielski             }
171*b1cdbd2cSJim Jagielski             break;
172*b1cdbd2cSJim Jagielski         }
173*b1cdbd2cSJim Jagielski         continue;
174*b1cdbd2cSJim Jagielski 
175*b1cdbd2cSJim Jagielski     transform:
176*b1cdbd2cSJim Jagielski         {
177*b1cdbd2cSJim Jagielski             sal_Int32 nPlaneOffset = pCns116431992PlaneOffsets[nPlane];
178*b1cdbd2cSJim Jagielski             if (nPlaneOffset == -1)
179*b1cdbd2cSJim Jagielski                 goto bad_input;
180*b1cdbd2cSJim Jagielski             else
181*b1cdbd2cSJim Jagielski             {
182*b1cdbd2cSJim Jagielski                 sal_Int32 nOffset
183*b1cdbd2cSJim Jagielski                     = pCns116431992RowOffsets[nPlaneOffset + nRow];
184*b1cdbd2cSJim Jagielski                 if (nOffset == -1)
185*b1cdbd2cSJim Jagielski                     goto bad_input;
186*b1cdbd2cSJim Jagielski                 else
187*b1cdbd2cSJim Jagielski                 {
188*b1cdbd2cSJim Jagielski                     sal_uInt32 nFirstLast = pCns116431992Data[nOffset++];
189*b1cdbd2cSJim Jagielski                     sal_uInt32 nFirst = nFirstLast & 0xFF;
190*b1cdbd2cSJim Jagielski                     sal_uInt32 nLast = nFirstLast >> 8;
191*b1cdbd2cSJim Jagielski                     nChar -= 0xA0;
192*b1cdbd2cSJim Jagielski                     if (nChar >= nFirst && nChar <= nLast)
193*b1cdbd2cSJim Jagielski                     {
194*b1cdbd2cSJim Jagielski                         sal_uInt32 nUnicode
195*b1cdbd2cSJim Jagielski                             = pCns116431992Data[nOffset + (nChar - nFirst)];
196*b1cdbd2cSJim Jagielski                         if (nUnicode == 0xFFFF)
197*b1cdbd2cSJim Jagielski                             goto bad_input;
198*b1cdbd2cSJim Jagielski                         else if (ImplIsHighSurrogate(nUnicode))
199*b1cdbd2cSJim Jagielski                             if (pDestBufEnd - pDestBufPtr >= 2)
200*b1cdbd2cSJim Jagielski                             {
201*b1cdbd2cSJim Jagielski                                 nOffset += nLast - nFirst + 1;
202*b1cdbd2cSJim Jagielski                                 nFirst = pCns116431992Data[nOffset++];
203*b1cdbd2cSJim Jagielski                                 *pDestBufPtr++ = (sal_Unicode) nUnicode;
204*b1cdbd2cSJim Jagielski                                 *pDestBufPtr++
205*b1cdbd2cSJim Jagielski                                     = (sal_Unicode)
206*b1cdbd2cSJim Jagielski                                           pCns116431992Data[
207*b1cdbd2cSJim Jagielski                                               nOffset + (nChar - nFirst)];
208*b1cdbd2cSJim Jagielski                             }
209*b1cdbd2cSJim Jagielski                             else
210*b1cdbd2cSJim Jagielski                                 goto no_output;
211*b1cdbd2cSJim Jagielski                         else
212*b1cdbd2cSJim Jagielski                             if (pDestBufPtr != pDestBufEnd)
213*b1cdbd2cSJim Jagielski                                 *pDestBufPtr++ = (sal_Unicode) nUnicode;
214*b1cdbd2cSJim Jagielski                             else
215*b1cdbd2cSJim Jagielski                                 goto no_output;
216*b1cdbd2cSJim Jagielski                     }
217*b1cdbd2cSJim Jagielski                     else
218*b1cdbd2cSJim Jagielski                         goto bad_input;
219*b1cdbd2cSJim Jagielski                     eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
220*b1cdbd2cSJim Jagielski                 }
221*b1cdbd2cSJim Jagielski             }
222*b1cdbd2cSJim Jagielski             continue;
223*b1cdbd2cSJim Jagielski         }
224*b1cdbd2cSJim Jagielski 
225*b1cdbd2cSJim Jagielski     bad_input:
226*b1cdbd2cSJim Jagielski         switch (ImplHandleBadInputTextToUnicodeConversion(
227*b1cdbd2cSJim Jagielski                     bUndefined, sal_True, 0, nFlags, &pDestBufPtr, pDestBufEnd,
228*b1cdbd2cSJim Jagielski                     &nInfo))
229*b1cdbd2cSJim Jagielski         {
230*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_STOP:
231*b1cdbd2cSJim Jagielski             eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
232*b1cdbd2cSJim Jagielski             break;
233*b1cdbd2cSJim Jagielski 
234*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_CONTINUE:
235*b1cdbd2cSJim Jagielski             eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
236*b1cdbd2cSJim Jagielski             continue;
237*b1cdbd2cSJim Jagielski 
238*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_NO_OUTPUT:
239*b1cdbd2cSJim Jagielski             goto no_output;
240*b1cdbd2cSJim Jagielski         }
241*b1cdbd2cSJim Jagielski         break;
242*b1cdbd2cSJim Jagielski 
243*b1cdbd2cSJim Jagielski     no_output:
244*b1cdbd2cSJim Jagielski         --pSrcBuf;
245*b1cdbd2cSJim Jagielski         nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
246*b1cdbd2cSJim Jagielski         break;
247*b1cdbd2cSJim Jagielski     }
248*b1cdbd2cSJim Jagielski 
249*b1cdbd2cSJim Jagielski     if (eState != IMPL_EUC_TW_TO_UNICODE_STATE_0
250*b1cdbd2cSJim Jagielski         && (nInfo & (RTL_TEXTTOUNICODE_INFO_ERROR
251*b1cdbd2cSJim Jagielski                          | RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL))
252*b1cdbd2cSJim Jagielski                == 0)
253*b1cdbd2cSJim Jagielski     {
254*b1cdbd2cSJim Jagielski         if ((nFlags & RTL_TEXTTOUNICODE_FLAGS_FLUSH) == 0)
255*b1cdbd2cSJim Jagielski             nInfo |= RTL_TEXTTOUNICODE_INFO_SRCBUFFERTOSMALL;
256*b1cdbd2cSJim Jagielski         else
257*b1cdbd2cSJim Jagielski             switch (ImplHandleBadInputTextToUnicodeConversion(
258*b1cdbd2cSJim Jagielski                         sal_False, sal_True, 0, nFlags, &pDestBufPtr,
259*b1cdbd2cSJim Jagielski                         pDestBufEnd, &nInfo))
260*b1cdbd2cSJim Jagielski             {
261*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_STOP:
262*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_CONTINUE:
263*b1cdbd2cSJim Jagielski                 eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
264*b1cdbd2cSJim Jagielski                 break;
265*b1cdbd2cSJim Jagielski 
266*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_NO_OUTPUT:
267*b1cdbd2cSJim Jagielski                 nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
268*b1cdbd2cSJim Jagielski                 break;
269*b1cdbd2cSJim Jagielski             }
270*b1cdbd2cSJim Jagielski     }
271*b1cdbd2cSJim Jagielski 
272*b1cdbd2cSJim Jagielski     if (pContext)
273*b1cdbd2cSJim Jagielski     {
274*b1cdbd2cSJim Jagielski         ((ImplEucTwToUnicodeContext *) pContext)->m_eState = eState;
275*b1cdbd2cSJim Jagielski         ((ImplEucTwToUnicodeContext *) pContext)->m_nPlane = nPlane;
276*b1cdbd2cSJim Jagielski         ((ImplEucTwToUnicodeContext *) pContext)->m_nRow = nRow;
277*b1cdbd2cSJim Jagielski     }
278*b1cdbd2cSJim Jagielski     if (pInfo)
279*b1cdbd2cSJim Jagielski         *pInfo = nInfo;
280*b1cdbd2cSJim Jagielski     if (pSrcCvtBytes)
281*b1cdbd2cSJim Jagielski         *pSrcCvtBytes = nConverted;
282*b1cdbd2cSJim Jagielski 
283*b1cdbd2cSJim Jagielski     return pDestBufPtr - pDestBuf;
284*b1cdbd2cSJim Jagielski }
285*b1cdbd2cSJim Jagielski 
ImplConvertUnicodeToEucTw(ImplTextConverterData const * pData,void * pContext,sal_Unicode const * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)286*b1cdbd2cSJim Jagielski sal_Size ImplConvertUnicodeToEucTw(ImplTextConverterData const * pData,
287*b1cdbd2cSJim Jagielski                                    void * pContext,
288*b1cdbd2cSJim Jagielski                                    sal_Unicode const * pSrcBuf,
289*b1cdbd2cSJim Jagielski                                    sal_Size nSrcChars,
290*b1cdbd2cSJim Jagielski                                    sal_Char * pDestBuf,
291*b1cdbd2cSJim Jagielski                                    sal_Size nDestBytes,
292*b1cdbd2cSJim Jagielski                                    sal_uInt32 nFlags,
293*b1cdbd2cSJim Jagielski                                    sal_uInt32 * pInfo,
294*b1cdbd2cSJim Jagielski                                    sal_Size * pSrcCvtChars)
295*b1cdbd2cSJim Jagielski {
296*b1cdbd2cSJim Jagielski     sal_uInt8 const * pCns116431992Data
297*b1cdbd2cSJim Jagielski         = ((ImplEucTwConverterData const *) pData)->
298*b1cdbd2cSJim Jagielski               m_pUnicodeToCns116431992Data;
299*b1cdbd2cSJim Jagielski     sal_Int32 const * pCns116431992PageOffsets
300*b1cdbd2cSJim Jagielski         = ((ImplEucTwConverterData const *) pData)->
301*b1cdbd2cSJim Jagielski               m_pUnicodeToCns116431992PageOffsets;
302*b1cdbd2cSJim Jagielski     sal_Int32 const * pCns116431992PlaneOffsets
303*b1cdbd2cSJim Jagielski         = ((ImplEucTwConverterData const *) pData)->
304*b1cdbd2cSJim Jagielski               m_pUnicodeToCns116431992PlaneOffsets;
305*b1cdbd2cSJim Jagielski     sal_Unicode nHighSurrogate = 0;
306*b1cdbd2cSJim Jagielski     sal_uInt32 nInfo = 0;
307*b1cdbd2cSJim Jagielski     sal_Size nConverted = 0;
308*b1cdbd2cSJim Jagielski     sal_Char * pDestBufPtr = pDestBuf;
309*b1cdbd2cSJim Jagielski     sal_Char * pDestBufEnd = pDestBuf + nDestBytes;
310*b1cdbd2cSJim Jagielski 
311*b1cdbd2cSJim Jagielski     if (pContext)
312*b1cdbd2cSJim Jagielski         nHighSurrogate
313*b1cdbd2cSJim Jagielski             = ((ImplUnicodeToTextContext *) pContext)->m_nHighSurrogate;
314*b1cdbd2cSJim Jagielski 
315*b1cdbd2cSJim Jagielski     for (; nConverted < nSrcChars; ++nConverted)
316*b1cdbd2cSJim Jagielski     {
317*b1cdbd2cSJim Jagielski         sal_Bool bUndefined = sal_True;
318*b1cdbd2cSJim Jagielski         sal_uInt32 nChar = *pSrcBuf++;
319*b1cdbd2cSJim Jagielski         if (nHighSurrogate == 0)
320*b1cdbd2cSJim Jagielski         {
321*b1cdbd2cSJim Jagielski             if (ImplIsHighSurrogate(nChar))
322*b1cdbd2cSJim Jagielski             {
323*b1cdbd2cSJim Jagielski                 nHighSurrogate = (sal_Unicode) nChar;
324*b1cdbd2cSJim Jagielski                 continue;
325*b1cdbd2cSJim Jagielski             }
326*b1cdbd2cSJim Jagielski         }
327*b1cdbd2cSJim Jagielski         else if (ImplIsLowSurrogate(nChar))
328*b1cdbd2cSJim Jagielski             nChar = ImplCombineSurrogates(nHighSurrogate, nChar);
329*b1cdbd2cSJim Jagielski         else
330*b1cdbd2cSJim Jagielski         {
331*b1cdbd2cSJim Jagielski             bUndefined = sal_False;
332*b1cdbd2cSJim Jagielski             goto bad_input;
333*b1cdbd2cSJim Jagielski         }
334*b1cdbd2cSJim Jagielski 
335*b1cdbd2cSJim Jagielski         if (ImplIsLowSurrogate(nChar) || ImplIsNoncharacter(nChar))
336*b1cdbd2cSJim Jagielski         {
337*b1cdbd2cSJim Jagielski             bUndefined = sal_False;
338*b1cdbd2cSJim Jagielski             goto bad_input;
339*b1cdbd2cSJim Jagielski         }
340*b1cdbd2cSJim Jagielski 
341*b1cdbd2cSJim Jagielski         if (nChar < 0x80)
342*b1cdbd2cSJim Jagielski             if (pDestBufPtr != pDestBufEnd)
343*b1cdbd2cSJim Jagielski                 *pDestBufPtr++ = (sal_Char) nChar;
344*b1cdbd2cSJim Jagielski             else
345*b1cdbd2cSJim Jagielski                 goto no_output;
346*b1cdbd2cSJim Jagielski         else
347*b1cdbd2cSJim Jagielski         {
348*b1cdbd2cSJim Jagielski             sal_Int32 nOffset = pCns116431992PlaneOffsets[nChar >> 16];
349*b1cdbd2cSJim Jagielski             sal_uInt32 nFirst;
350*b1cdbd2cSJim Jagielski             sal_uInt32 nLast;
351*b1cdbd2cSJim Jagielski             sal_uInt32 nPlane;
352*b1cdbd2cSJim Jagielski             if (nOffset == -1)
353*b1cdbd2cSJim Jagielski                 goto bad_input;
354*b1cdbd2cSJim Jagielski             nOffset
355*b1cdbd2cSJim Jagielski                 = pCns116431992PageOffsets[nOffset + ((nChar & 0xFF00) >> 8)];
356*b1cdbd2cSJim Jagielski             if (nOffset == -1)
357*b1cdbd2cSJim Jagielski                 goto bad_input;
358*b1cdbd2cSJim Jagielski             nFirst = pCns116431992Data[nOffset++];
359*b1cdbd2cSJim Jagielski             nLast = pCns116431992Data[nOffset++];
360*b1cdbd2cSJim Jagielski             nChar &= 0xFF;
361*b1cdbd2cSJim Jagielski             if (nChar < nFirst || nChar > nLast)
362*b1cdbd2cSJim Jagielski                 goto bad_input;
363*b1cdbd2cSJim Jagielski             nOffset += 3 * (nChar - nFirst);
364*b1cdbd2cSJim Jagielski             nPlane = pCns116431992Data[nOffset++];
365*b1cdbd2cSJim Jagielski             if (nPlane == 0)
366*b1cdbd2cSJim Jagielski                 goto bad_input;
367*b1cdbd2cSJim Jagielski             if (pDestBufEnd - pDestBufPtr < (nPlane == 1 ? 2 : 4))
368*b1cdbd2cSJim Jagielski                 goto no_output;
369*b1cdbd2cSJim Jagielski             if (nPlane != 1)
370*b1cdbd2cSJim Jagielski             {
371*b1cdbd2cSJim Jagielski                 *pDestBufPtr++ = (sal_Char) (unsigned char) 0x8E;
372*b1cdbd2cSJim Jagielski                 *pDestBufPtr++ = (sal_Char) (0xA0 + nPlane);
373*b1cdbd2cSJim Jagielski             }
374*b1cdbd2cSJim Jagielski             *pDestBufPtr++ = (sal_Char) (0xA0 + pCns116431992Data[nOffset++]);
375*b1cdbd2cSJim Jagielski             *pDestBufPtr++ = (sal_Char) (0xA0 + pCns116431992Data[nOffset]);
376*b1cdbd2cSJim Jagielski         }
377*b1cdbd2cSJim Jagielski         nHighSurrogate = 0;
378*b1cdbd2cSJim Jagielski         continue;
379*b1cdbd2cSJim Jagielski 
380*b1cdbd2cSJim Jagielski     bad_input:
381*b1cdbd2cSJim Jagielski         switch (ImplHandleBadInputUnicodeToTextConversion(bUndefined,
382*b1cdbd2cSJim Jagielski                                                           nChar,
383*b1cdbd2cSJim Jagielski                                                           nFlags,
384*b1cdbd2cSJim Jagielski                                                           &pDestBufPtr,
385*b1cdbd2cSJim Jagielski                                                           pDestBufEnd,
386*b1cdbd2cSJim Jagielski                                                           &nInfo,
387*b1cdbd2cSJim Jagielski                                                           NULL,
388*b1cdbd2cSJim Jagielski                                                           0,
389*b1cdbd2cSJim Jagielski                                                           NULL))
390*b1cdbd2cSJim Jagielski         {
391*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_STOP:
392*b1cdbd2cSJim Jagielski             nHighSurrogate = 0;
393*b1cdbd2cSJim Jagielski             break;
394*b1cdbd2cSJim Jagielski 
395*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_CONTINUE:
396*b1cdbd2cSJim Jagielski             nHighSurrogate = 0;
397*b1cdbd2cSJim Jagielski             continue;
398*b1cdbd2cSJim Jagielski 
399*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_NO_OUTPUT:
400*b1cdbd2cSJim Jagielski             goto no_output;
401*b1cdbd2cSJim Jagielski         }
402*b1cdbd2cSJim Jagielski         break;
403*b1cdbd2cSJim Jagielski 
404*b1cdbd2cSJim Jagielski     no_output:
405*b1cdbd2cSJim Jagielski         --pSrcBuf;
406*b1cdbd2cSJim Jagielski         nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
407*b1cdbd2cSJim Jagielski         break;
408*b1cdbd2cSJim Jagielski     }
409*b1cdbd2cSJim Jagielski 
410*b1cdbd2cSJim Jagielski     if (nHighSurrogate != 0
411*b1cdbd2cSJim Jagielski         && (nInfo & (RTL_UNICODETOTEXT_INFO_ERROR
412*b1cdbd2cSJim Jagielski                          | RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL))
413*b1cdbd2cSJim Jagielski                == 0)
414*b1cdbd2cSJim Jagielski     {
415*b1cdbd2cSJim Jagielski         if ((nFlags & RTL_UNICODETOTEXT_FLAGS_FLUSH) != 0)
416*b1cdbd2cSJim Jagielski             nInfo |= RTL_UNICODETOTEXT_INFO_SRCBUFFERTOSMALL;
417*b1cdbd2cSJim Jagielski         else
418*b1cdbd2cSJim Jagielski             switch (ImplHandleBadInputUnicodeToTextConversion(sal_False,
419*b1cdbd2cSJim Jagielski                                                               0,
420*b1cdbd2cSJim Jagielski                                                               nFlags,
421*b1cdbd2cSJim Jagielski                                                               &pDestBufPtr,
422*b1cdbd2cSJim Jagielski                                                               pDestBufEnd,
423*b1cdbd2cSJim Jagielski                                                               &nInfo,
424*b1cdbd2cSJim Jagielski                                                               NULL,
425*b1cdbd2cSJim Jagielski                                                               0,
426*b1cdbd2cSJim Jagielski                                                               NULL))
427*b1cdbd2cSJim Jagielski             {
428*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_STOP:
429*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_CONTINUE:
430*b1cdbd2cSJim Jagielski                 nHighSurrogate = 0;
431*b1cdbd2cSJim Jagielski                 break;
432*b1cdbd2cSJim Jagielski 
433*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_NO_OUTPUT:
434*b1cdbd2cSJim Jagielski                 nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
435*b1cdbd2cSJim Jagielski                 break;
436*b1cdbd2cSJim Jagielski             }
437*b1cdbd2cSJim Jagielski     }
438*b1cdbd2cSJim Jagielski 
439*b1cdbd2cSJim Jagielski     if (pContext)
440*b1cdbd2cSJim Jagielski         ((ImplUnicodeToTextContext *) pContext)->m_nHighSurrogate
441*b1cdbd2cSJim Jagielski             = nHighSurrogate;
442*b1cdbd2cSJim Jagielski     if (pInfo)
443*b1cdbd2cSJim Jagielski         *pInfo = nInfo;
444*b1cdbd2cSJim Jagielski     if (pSrcCvtChars)
445*b1cdbd2cSJim Jagielski         *pSrcCvtChars = nConverted;
446*b1cdbd2cSJim Jagielski 
447*b1cdbd2cSJim Jagielski     return pDestBufPtr - pDestBuf;
448*b1cdbd2cSJim Jagielski }
449