1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski *
3*b1cdbd2cSJim Jagielski * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski * or more contributor license agreements. See the NOTICE file
5*b1cdbd2cSJim Jagielski * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski * regarding copyright ownership. The ASF licenses this file
7*b1cdbd2cSJim Jagielski * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski * with the License. You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski *
11*b1cdbd2cSJim Jagielski * http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski *
13*b1cdbd2cSJim Jagielski * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski * KIND, either express or implied. See the License for the
17*b1cdbd2cSJim Jagielski * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski * under the License.
19*b1cdbd2cSJim Jagielski *
20*b1cdbd2cSJim Jagielski *************************************************************/
21*b1cdbd2cSJim Jagielski
22*b1cdbd2cSJim Jagielski
23*b1cdbd2cSJim Jagielski
24*b1cdbd2cSJim Jagielski #include "converteuctw.h"
25*b1cdbd2cSJim Jagielski #include "context.h"
26*b1cdbd2cSJim Jagielski #include "converter.h"
27*b1cdbd2cSJim Jagielski #include "tenchelp.h"
28*b1cdbd2cSJim Jagielski #include "unichars.h"
29*b1cdbd2cSJim Jagielski #include "rtl/alloc.h"
30*b1cdbd2cSJim Jagielski #include "rtl/textcvt.h"
31*b1cdbd2cSJim Jagielski #include "sal/types.h"
32*b1cdbd2cSJim Jagielski
33*b1cdbd2cSJim Jagielski typedef enum
34*b1cdbd2cSJim Jagielski {
35*b1cdbd2cSJim Jagielski IMPL_EUC_TW_TO_UNICODE_STATE_0,
36*b1cdbd2cSJim Jagielski IMPL_EUC_TW_TO_UNICODE_STATE_1,
37*b1cdbd2cSJim Jagielski IMPL_EUC_TW_TO_UNICODE_STATE_2_1,
38*b1cdbd2cSJim Jagielski IMPL_EUC_TW_TO_UNICODE_STATE_2_2,
39*b1cdbd2cSJim Jagielski IMPL_EUC_TW_TO_UNICODE_STATE_2_3
40*b1cdbd2cSJim Jagielski } ImplEucTwToUnicodeState;
41*b1cdbd2cSJim Jagielski
42*b1cdbd2cSJim Jagielski typedef struct
43*b1cdbd2cSJim Jagielski {
44*b1cdbd2cSJim Jagielski ImplEucTwToUnicodeState m_eState;
45*b1cdbd2cSJim Jagielski sal_Int32 m_nPlane; /* 0--15 */
46*b1cdbd2cSJim Jagielski sal_Int32 m_nRow; /* 0--93 */
47*b1cdbd2cSJim Jagielski } ImplEucTwToUnicodeContext;
48*b1cdbd2cSJim Jagielski
ImplCreateEucTwToUnicodeContext(void)49*b1cdbd2cSJim Jagielski void * ImplCreateEucTwToUnicodeContext(void)
50*b1cdbd2cSJim Jagielski {
51*b1cdbd2cSJim Jagielski void * pContext = rtl_allocateMemory(sizeof (ImplEucTwToUnicodeContext));
52*b1cdbd2cSJim Jagielski ((ImplEucTwToUnicodeContext *) pContext)->m_eState
53*b1cdbd2cSJim Jagielski = IMPL_EUC_TW_TO_UNICODE_STATE_0;
54*b1cdbd2cSJim Jagielski return pContext;
55*b1cdbd2cSJim Jagielski }
56*b1cdbd2cSJim Jagielski
ImplResetEucTwToUnicodeContext(void * pContext)57*b1cdbd2cSJim Jagielski void ImplResetEucTwToUnicodeContext(void * pContext)
58*b1cdbd2cSJim Jagielski {
59*b1cdbd2cSJim Jagielski if (pContext)
60*b1cdbd2cSJim Jagielski ((ImplEucTwToUnicodeContext *) pContext)->m_eState
61*b1cdbd2cSJim Jagielski = IMPL_EUC_TW_TO_UNICODE_STATE_0;
62*b1cdbd2cSJim Jagielski }
63*b1cdbd2cSJim Jagielski
ImplConvertEucTwToUnicode(ImplTextConverterData const * pData,void * pContext,sal_Char const * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)64*b1cdbd2cSJim Jagielski sal_Size ImplConvertEucTwToUnicode(ImplTextConverterData const * pData,
65*b1cdbd2cSJim Jagielski void * pContext,
66*b1cdbd2cSJim Jagielski sal_Char const * pSrcBuf,
67*b1cdbd2cSJim Jagielski sal_Size nSrcBytes,
68*b1cdbd2cSJim Jagielski sal_Unicode * pDestBuf,
69*b1cdbd2cSJim Jagielski sal_Size nDestChars,
70*b1cdbd2cSJim Jagielski sal_uInt32 nFlags,
71*b1cdbd2cSJim Jagielski sal_uInt32 * pInfo,
72*b1cdbd2cSJim Jagielski sal_Size * pSrcCvtBytes)
73*b1cdbd2cSJim Jagielski {
74*b1cdbd2cSJim Jagielski sal_uInt16 const * pCns116431992Data
75*b1cdbd2cSJim Jagielski = ((ImplEucTwConverterData const *) pData)->
76*b1cdbd2cSJim Jagielski m_pCns116431992ToUnicodeData;
77*b1cdbd2cSJim Jagielski sal_Int32 const * pCns116431992RowOffsets
78*b1cdbd2cSJim Jagielski = ((ImplEucTwConverterData const *) pData)->
79*b1cdbd2cSJim Jagielski m_pCns116431992ToUnicodeRowOffsets;
80*b1cdbd2cSJim Jagielski sal_Int32 const * pCns116431992PlaneOffsets
81*b1cdbd2cSJim Jagielski = ((ImplEucTwConverterData const *) pData)->
82*b1cdbd2cSJim Jagielski m_pCns116431992ToUnicodePlaneOffsets;
83*b1cdbd2cSJim Jagielski ImplEucTwToUnicodeState eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
84*b1cdbd2cSJim Jagielski sal_Int32 nPlane = 0;
85*b1cdbd2cSJim Jagielski sal_Int32 nRow = 0;
86*b1cdbd2cSJim Jagielski sal_uInt32 nInfo = 0;
87*b1cdbd2cSJim Jagielski sal_Size nConverted = 0;
88*b1cdbd2cSJim Jagielski sal_Unicode * pDestBufPtr = pDestBuf;
89*b1cdbd2cSJim Jagielski sal_Unicode * pDestBufEnd = pDestBuf + nDestChars;
90*b1cdbd2cSJim Jagielski
91*b1cdbd2cSJim Jagielski if (pContext)
92*b1cdbd2cSJim Jagielski {
93*b1cdbd2cSJim Jagielski eState = ((ImplEucTwToUnicodeContext *) pContext)->m_eState;
94*b1cdbd2cSJim Jagielski nPlane = ((ImplEucTwToUnicodeContext *) pContext)->m_nPlane;
95*b1cdbd2cSJim Jagielski nRow = ((ImplEucTwToUnicodeContext *) pContext)->m_nRow;
96*b1cdbd2cSJim Jagielski }
97*b1cdbd2cSJim Jagielski
98*b1cdbd2cSJim Jagielski for (; nConverted < nSrcBytes; ++nConverted)
99*b1cdbd2cSJim Jagielski {
100*b1cdbd2cSJim Jagielski sal_Bool bUndefined = sal_True;
101*b1cdbd2cSJim Jagielski sal_uInt32 nChar = *(sal_uChar const *) pSrcBuf++;
102*b1cdbd2cSJim Jagielski switch (eState)
103*b1cdbd2cSJim Jagielski {
104*b1cdbd2cSJim Jagielski case IMPL_EUC_TW_TO_UNICODE_STATE_0:
105*b1cdbd2cSJim Jagielski if (nChar < 0x80)
106*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
107*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Unicode) nChar;
108*b1cdbd2cSJim Jagielski else
109*b1cdbd2cSJim Jagielski goto no_output;
110*b1cdbd2cSJim Jagielski else if (nChar >= 0xA1 && nChar <= 0xFE)
111*b1cdbd2cSJim Jagielski {
112*b1cdbd2cSJim Jagielski nRow = nChar - 0xA1;
113*b1cdbd2cSJim Jagielski eState = IMPL_EUC_TW_TO_UNICODE_STATE_1;
114*b1cdbd2cSJim Jagielski }
115*b1cdbd2cSJim Jagielski else if (nChar == 0x8E)
116*b1cdbd2cSJim Jagielski eState = IMPL_EUC_TW_TO_UNICODE_STATE_2_1;
117*b1cdbd2cSJim Jagielski else
118*b1cdbd2cSJim Jagielski {
119*b1cdbd2cSJim Jagielski bUndefined = sal_False;
120*b1cdbd2cSJim Jagielski goto bad_input;
121*b1cdbd2cSJim Jagielski }
122*b1cdbd2cSJim Jagielski break;
123*b1cdbd2cSJim Jagielski
124*b1cdbd2cSJim Jagielski case IMPL_EUC_TW_TO_UNICODE_STATE_1:
125*b1cdbd2cSJim Jagielski if (nChar >= 0xA1 && nChar <= 0xFE)
126*b1cdbd2cSJim Jagielski {
127*b1cdbd2cSJim Jagielski nPlane = 0;
128*b1cdbd2cSJim Jagielski goto transform;
129*b1cdbd2cSJim Jagielski }
130*b1cdbd2cSJim Jagielski else
131*b1cdbd2cSJim Jagielski {
132*b1cdbd2cSJim Jagielski bUndefined = sal_False;
133*b1cdbd2cSJim Jagielski goto bad_input;
134*b1cdbd2cSJim Jagielski }
135*b1cdbd2cSJim Jagielski break;
136*b1cdbd2cSJim Jagielski
137*b1cdbd2cSJim Jagielski case IMPL_EUC_TW_TO_UNICODE_STATE_2_1:
138*b1cdbd2cSJim Jagielski if (nChar >= 0xA1 && nChar <= 0xB0)
139*b1cdbd2cSJim Jagielski {
140*b1cdbd2cSJim Jagielski nPlane = nChar - 0xA1;
141*b1cdbd2cSJim Jagielski ++eState;
142*b1cdbd2cSJim Jagielski }
143*b1cdbd2cSJim Jagielski else
144*b1cdbd2cSJim Jagielski {
145*b1cdbd2cSJim Jagielski bUndefined = sal_False;
146*b1cdbd2cSJim Jagielski goto bad_input;
147*b1cdbd2cSJim Jagielski }
148*b1cdbd2cSJim Jagielski break;
149*b1cdbd2cSJim Jagielski
150*b1cdbd2cSJim Jagielski case IMPL_EUC_TW_TO_UNICODE_STATE_2_2:
151*b1cdbd2cSJim Jagielski if (nChar >= 0xA1 && nChar <= 0xFE)
152*b1cdbd2cSJim Jagielski {
153*b1cdbd2cSJim Jagielski nRow = nChar - 0xA1;
154*b1cdbd2cSJim Jagielski ++eState;
155*b1cdbd2cSJim Jagielski }
156*b1cdbd2cSJim Jagielski else
157*b1cdbd2cSJim Jagielski {
158*b1cdbd2cSJim Jagielski bUndefined = sal_False;
159*b1cdbd2cSJim Jagielski goto bad_input;
160*b1cdbd2cSJim Jagielski }
161*b1cdbd2cSJim Jagielski break;
162*b1cdbd2cSJim Jagielski
163*b1cdbd2cSJim Jagielski case IMPL_EUC_TW_TO_UNICODE_STATE_2_3:
164*b1cdbd2cSJim Jagielski if (nChar >= 0xA1 && nChar <= 0xFE)
165*b1cdbd2cSJim Jagielski goto transform;
166*b1cdbd2cSJim Jagielski else
167*b1cdbd2cSJim Jagielski {
168*b1cdbd2cSJim Jagielski bUndefined = sal_False;
169*b1cdbd2cSJim Jagielski goto bad_input;
170*b1cdbd2cSJim Jagielski }
171*b1cdbd2cSJim Jagielski break;
172*b1cdbd2cSJim Jagielski }
173*b1cdbd2cSJim Jagielski continue;
174*b1cdbd2cSJim Jagielski
175*b1cdbd2cSJim Jagielski transform:
176*b1cdbd2cSJim Jagielski {
177*b1cdbd2cSJim Jagielski sal_Int32 nPlaneOffset = pCns116431992PlaneOffsets[nPlane];
178*b1cdbd2cSJim Jagielski if (nPlaneOffset == -1)
179*b1cdbd2cSJim Jagielski goto bad_input;
180*b1cdbd2cSJim Jagielski else
181*b1cdbd2cSJim Jagielski {
182*b1cdbd2cSJim Jagielski sal_Int32 nOffset
183*b1cdbd2cSJim Jagielski = pCns116431992RowOffsets[nPlaneOffset + nRow];
184*b1cdbd2cSJim Jagielski if (nOffset == -1)
185*b1cdbd2cSJim Jagielski goto bad_input;
186*b1cdbd2cSJim Jagielski else
187*b1cdbd2cSJim Jagielski {
188*b1cdbd2cSJim Jagielski sal_uInt32 nFirstLast = pCns116431992Data[nOffset++];
189*b1cdbd2cSJim Jagielski sal_uInt32 nFirst = nFirstLast & 0xFF;
190*b1cdbd2cSJim Jagielski sal_uInt32 nLast = nFirstLast >> 8;
191*b1cdbd2cSJim Jagielski nChar -= 0xA0;
192*b1cdbd2cSJim Jagielski if (nChar >= nFirst && nChar <= nLast)
193*b1cdbd2cSJim Jagielski {
194*b1cdbd2cSJim Jagielski sal_uInt32 nUnicode
195*b1cdbd2cSJim Jagielski = pCns116431992Data[nOffset + (nChar - nFirst)];
196*b1cdbd2cSJim Jagielski if (nUnicode == 0xFFFF)
197*b1cdbd2cSJim Jagielski goto bad_input;
198*b1cdbd2cSJim Jagielski else if (ImplIsHighSurrogate(nUnicode))
199*b1cdbd2cSJim Jagielski if (pDestBufEnd - pDestBufPtr >= 2)
200*b1cdbd2cSJim Jagielski {
201*b1cdbd2cSJim Jagielski nOffset += nLast - nFirst + 1;
202*b1cdbd2cSJim Jagielski nFirst = pCns116431992Data[nOffset++];
203*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Unicode) nUnicode;
204*b1cdbd2cSJim Jagielski *pDestBufPtr++
205*b1cdbd2cSJim Jagielski = (sal_Unicode)
206*b1cdbd2cSJim Jagielski pCns116431992Data[
207*b1cdbd2cSJim Jagielski nOffset + (nChar - nFirst)];
208*b1cdbd2cSJim Jagielski }
209*b1cdbd2cSJim Jagielski else
210*b1cdbd2cSJim Jagielski goto no_output;
211*b1cdbd2cSJim Jagielski else
212*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
213*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Unicode) nUnicode;
214*b1cdbd2cSJim Jagielski else
215*b1cdbd2cSJim Jagielski goto no_output;
216*b1cdbd2cSJim Jagielski }
217*b1cdbd2cSJim Jagielski else
218*b1cdbd2cSJim Jagielski goto bad_input;
219*b1cdbd2cSJim Jagielski eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
220*b1cdbd2cSJim Jagielski }
221*b1cdbd2cSJim Jagielski }
222*b1cdbd2cSJim Jagielski continue;
223*b1cdbd2cSJim Jagielski }
224*b1cdbd2cSJim Jagielski
225*b1cdbd2cSJim Jagielski bad_input:
226*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputTextToUnicodeConversion(
227*b1cdbd2cSJim Jagielski bUndefined, sal_True, 0, nFlags, &pDestBufPtr, pDestBufEnd,
228*b1cdbd2cSJim Jagielski &nInfo))
229*b1cdbd2cSJim Jagielski {
230*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
231*b1cdbd2cSJim Jagielski eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
232*b1cdbd2cSJim Jagielski break;
233*b1cdbd2cSJim Jagielski
234*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
235*b1cdbd2cSJim Jagielski eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
236*b1cdbd2cSJim Jagielski continue;
237*b1cdbd2cSJim Jagielski
238*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
239*b1cdbd2cSJim Jagielski goto no_output;
240*b1cdbd2cSJim Jagielski }
241*b1cdbd2cSJim Jagielski break;
242*b1cdbd2cSJim Jagielski
243*b1cdbd2cSJim Jagielski no_output:
244*b1cdbd2cSJim Jagielski --pSrcBuf;
245*b1cdbd2cSJim Jagielski nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
246*b1cdbd2cSJim Jagielski break;
247*b1cdbd2cSJim Jagielski }
248*b1cdbd2cSJim Jagielski
249*b1cdbd2cSJim Jagielski if (eState != IMPL_EUC_TW_TO_UNICODE_STATE_0
250*b1cdbd2cSJim Jagielski && (nInfo & (RTL_TEXTTOUNICODE_INFO_ERROR
251*b1cdbd2cSJim Jagielski | RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL))
252*b1cdbd2cSJim Jagielski == 0)
253*b1cdbd2cSJim Jagielski {
254*b1cdbd2cSJim Jagielski if ((nFlags & RTL_TEXTTOUNICODE_FLAGS_FLUSH) == 0)
255*b1cdbd2cSJim Jagielski nInfo |= RTL_TEXTTOUNICODE_INFO_SRCBUFFERTOSMALL;
256*b1cdbd2cSJim Jagielski else
257*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputTextToUnicodeConversion(
258*b1cdbd2cSJim Jagielski sal_False, sal_True, 0, nFlags, &pDestBufPtr,
259*b1cdbd2cSJim Jagielski pDestBufEnd, &nInfo))
260*b1cdbd2cSJim Jagielski {
261*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
262*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
263*b1cdbd2cSJim Jagielski eState = IMPL_EUC_TW_TO_UNICODE_STATE_0;
264*b1cdbd2cSJim Jagielski break;
265*b1cdbd2cSJim Jagielski
266*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
267*b1cdbd2cSJim Jagielski nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
268*b1cdbd2cSJim Jagielski break;
269*b1cdbd2cSJim Jagielski }
270*b1cdbd2cSJim Jagielski }
271*b1cdbd2cSJim Jagielski
272*b1cdbd2cSJim Jagielski if (pContext)
273*b1cdbd2cSJim Jagielski {
274*b1cdbd2cSJim Jagielski ((ImplEucTwToUnicodeContext *) pContext)->m_eState = eState;
275*b1cdbd2cSJim Jagielski ((ImplEucTwToUnicodeContext *) pContext)->m_nPlane = nPlane;
276*b1cdbd2cSJim Jagielski ((ImplEucTwToUnicodeContext *) pContext)->m_nRow = nRow;
277*b1cdbd2cSJim Jagielski }
278*b1cdbd2cSJim Jagielski if (pInfo)
279*b1cdbd2cSJim Jagielski *pInfo = nInfo;
280*b1cdbd2cSJim Jagielski if (pSrcCvtBytes)
281*b1cdbd2cSJim Jagielski *pSrcCvtBytes = nConverted;
282*b1cdbd2cSJim Jagielski
283*b1cdbd2cSJim Jagielski return pDestBufPtr - pDestBuf;
284*b1cdbd2cSJim Jagielski }
285*b1cdbd2cSJim Jagielski
ImplConvertUnicodeToEucTw(ImplTextConverterData const * pData,void * pContext,sal_Unicode const * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)286*b1cdbd2cSJim Jagielski sal_Size ImplConvertUnicodeToEucTw(ImplTextConverterData const * pData,
287*b1cdbd2cSJim Jagielski void * pContext,
288*b1cdbd2cSJim Jagielski sal_Unicode const * pSrcBuf,
289*b1cdbd2cSJim Jagielski sal_Size nSrcChars,
290*b1cdbd2cSJim Jagielski sal_Char * pDestBuf,
291*b1cdbd2cSJim Jagielski sal_Size nDestBytes,
292*b1cdbd2cSJim Jagielski sal_uInt32 nFlags,
293*b1cdbd2cSJim Jagielski sal_uInt32 * pInfo,
294*b1cdbd2cSJim Jagielski sal_Size * pSrcCvtChars)
295*b1cdbd2cSJim Jagielski {
296*b1cdbd2cSJim Jagielski sal_uInt8 const * pCns116431992Data
297*b1cdbd2cSJim Jagielski = ((ImplEucTwConverterData const *) pData)->
298*b1cdbd2cSJim Jagielski m_pUnicodeToCns116431992Data;
299*b1cdbd2cSJim Jagielski sal_Int32 const * pCns116431992PageOffsets
300*b1cdbd2cSJim Jagielski = ((ImplEucTwConverterData const *) pData)->
301*b1cdbd2cSJim Jagielski m_pUnicodeToCns116431992PageOffsets;
302*b1cdbd2cSJim Jagielski sal_Int32 const * pCns116431992PlaneOffsets
303*b1cdbd2cSJim Jagielski = ((ImplEucTwConverterData const *) pData)->
304*b1cdbd2cSJim Jagielski m_pUnicodeToCns116431992PlaneOffsets;
305*b1cdbd2cSJim Jagielski sal_Unicode nHighSurrogate = 0;
306*b1cdbd2cSJim Jagielski sal_uInt32 nInfo = 0;
307*b1cdbd2cSJim Jagielski sal_Size nConverted = 0;
308*b1cdbd2cSJim Jagielski sal_Char * pDestBufPtr = pDestBuf;
309*b1cdbd2cSJim Jagielski sal_Char * pDestBufEnd = pDestBuf + nDestBytes;
310*b1cdbd2cSJim Jagielski
311*b1cdbd2cSJim Jagielski if (pContext)
312*b1cdbd2cSJim Jagielski nHighSurrogate
313*b1cdbd2cSJim Jagielski = ((ImplUnicodeToTextContext *) pContext)->m_nHighSurrogate;
314*b1cdbd2cSJim Jagielski
315*b1cdbd2cSJim Jagielski for (; nConverted < nSrcChars; ++nConverted)
316*b1cdbd2cSJim Jagielski {
317*b1cdbd2cSJim Jagielski sal_Bool bUndefined = sal_True;
318*b1cdbd2cSJim Jagielski sal_uInt32 nChar = *pSrcBuf++;
319*b1cdbd2cSJim Jagielski if (nHighSurrogate == 0)
320*b1cdbd2cSJim Jagielski {
321*b1cdbd2cSJim Jagielski if (ImplIsHighSurrogate(nChar))
322*b1cdbd2cSJim Jagielski {
323*b1cdbd2cSJim Jagielski nHighSurrogate = (sal_Unicode) nChar;
324*b1cdbd2cSJim Jagielski continue;
325*b1cdbd2cSJim Jagielski }
326*b1cdbd2cSJim Jagielski }
327*b1cdbd2cSJim Jagielski else if (ImplIsLowSurrogate(nChar))
328*b1cdbd2cSJim Jagielski nChar = ImplCombineSurrogates(nHighSurrogate, nChar);
329*b1cdbd2cSJim Jagielski else
330*b1cdbd2cSJim Jagielski {
331*b1cdbd2cSJim Jagielski bUndefined = sal_False;
332*b1cdbd2cSJim Jagielski goto bad_input;
333*b1cdbd2cSJim Jagielski }
334*b1cdbd2cSJim Jagielski
335*b1cdbd2cSJim Jagielski if (ImplIsLowSurrogate(nChar) || ImplIsNoncharacter(nChar))
336*b1cdbd2cSJim Jagielski {
337*b1cdbd2cSJim Jagielski bUndefined = sal_False;
338*b1cdbd2cSJim Jagielski goto bad_input;
339*b1cdbd2cSJim Jagielski }
340*b1cdbd2cSJim Jagielski
341*b1cdbd2cSJim Jagielski if (nChar < 0x80)
342*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
343*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) nChar;
344*b1cdbd2cSJim Jagielski else
345*b1cdbd2cSJim Jagielski goto no_output;
346*b1cdbd2cSJim Jagielski else
347*b1cdbd2cSJim Jagielski {
348*b1cdbd2cSJim Jagielski sal_Int32 nOffset = pCns116431992PlaneOffsets[nChar >> 16];
349*b1cdbd2cSJim Jagielski sal_uInt32 nFirst;
350*b1cdbd2cSJim Jagielski sal_uInt32 nLast;
351*b1cdbd2cSJim Jagielski sal_uInt32 nPlane;
352*b1cdbd2cSJim Jagielski if (nOffset == -1)
353*b1cdbd2cSJim Jagielski goto bad_input;
354*b1cdbd2cSJim Jagielski nOffset
355*b1cdbd2cSJim Jagielski = pCns116431992PageOffsets[nOffset + ((nChar & 0xFF00) >> 8)];
356*b1cdbd2cSJim Jagielski if (nOffset == -1)
357*b1cdbd2cSJim Jagielski goto bad_input;
358*b1cdbd2cSJim Jagielski nFirst = pCns116431992Data[nOffset++];
359*b1cdbd2cSJim Jagielski nLast = pCns116431992Data[nOffset++];
360*b1cdbd2cSJim Jagielski nChar &= 0xFF;
361*b1cdbd2cSJim Jagielski if (nChar < nFirst || nChar > nLast)
362*b1cdbd2cSJim Jagielski goto bad_input;
363*b1cdbd2cSJim Jagielski nOffset += 3 * (nChar - nFirst);
364*b1cdbd2cSJim Jagielski nPlane = pCns116431992Data[nOffset++];
365*b1cdbd2cSJim Jagielski if (nPlane == 0)
366*b1cdbd2cSJim Jagielski goto bad_input;
367*b1cdbd2cSJim Jagielski if (pDestBufEnd - pDestBufPtr < (nPlane == 1 ? 2 : 4))
368*b1cdbd2cSJim Jagielski goto no_output;
369*b1cdbd2cSJim Jagielski if (nPlane != 1)
370*b1cdbd2cSJim Jagielski {
371*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) (unsigned char) 0x8E;
372*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) (0xA0 + nPlane);
373*b1cdbd2cSJim Jagielski }
374*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) (0xA0 + pCns116431992Data[nOffset++]);
375*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) (0xA0 + pCns116431992Data[nOffset]);
376*b1cdbd2cSJim Jagielski }
377*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
378*b1cdbd2cSJim Jagielski continue;
379*b1cdbd2cSJim Jagielski
380*b1cdbd2cSJim Jagielski bad_input:
381*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputUnicodeToTextConversion(bUndefined,
382*b1cdbd2cSJim Jagielski nChar,
383*b1cdbd2cSJim Jagielski nFlags,
384*b1cdbd2cSJim Jagielski &pDestBufPtr,
385*b1cdbd2cSJim Jagielski pDestBufEnd,
386*b1cdbd2cSJim Jagielski &nInfo,
387*b1cdbd2cSJim Jagielski NULL,
388*b1cdbd2cSJim Jagielski 0,
389*b1cdbd2cSJim Jagielski NULL))
390*b1cdbd2cSJim Jagielski {
391*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
392*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
393*b1cdbd2cSJim Jagielski break;
394*b1cdbd2cSJim Jagielski
395*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
396*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
397*b1cdbd2cSJim Jagielski continue;
398*b1cdbd2cSJim Jagielski
399*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
400*b1cdbd2cSJim Jagielski goto no_output;
401*b1cdbd2cSJim Jagielski }
402*b1cdbd2cSJim Jagielski break;
403*b1cdbd2cSJim Jagielski
404*b1cdbd2cSJim Jagielski no_output:
405*b1cdbd2cSJim Jagielski --pSrcBuf;
406*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
407*b1cdbd2cSJim Jagielski break;
408*b1cdbd2cSJim Jagielski }
409*b1cdbd2cSJim Jagielski
410*b1cdbd2cSJim Jagielski if (nHighSurrogate != 0
411*b1cdbd2cSJim Jagielski && (nInfo & (RTL_UNICODETOTEXT_INFO_ERROR
412*b1cdbd2cSJim Jagielski | RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL))
413*b1cdbd2cSJim Jagielski == 0)
414*b1cdbd2cSJim Jagielski {
415*b1cdbd2cSJim Jagielski if ((nFlags & RTL_UNICODETOTEXT_FLAGS_FLUSH) != 0)
416*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_SRCBUFFERTOSMALL;
417*b1cdbd2cSJim Jagielski else
418*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputUnicodeToTextConversion(sal_False,
419*b1cdbd2cSJim Jagielski 0,
420*b1cdbd2cSJim Jagielski nFlags,
421*b1cdbd2cSJim Jagielski &pDestBufPtr,
422*b1cdbd2cSJim Jagielski pDestBufEnd,
423*b1cdbd2cSJim Jagielski &nInfo,
424*b1cdbd2cSJim Jagielski NULL,
425*b1cdbd2cSJim Jagielski 0,
426*b1cdbd2cSJim Jagielski NULL))
427*b1cdbd2cSJim Jagielski {
428*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
429*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
430*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
431*b1cdbd2cSJim Jagielski break;
432*b1cdbd2cSJim Jagielski
433*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
434*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
435*b1cdbd2cSJim Jagielski break;
436*b1cdbd2cSJim Jagielski }
437*b1cdbd2cSJim Jagielski }
438*b1cdbd2cSJim Jagielski
439*b1cdbd2cSJim Jagielski if (pContext)
440*b1cdbd2cSJim Jagielski ((ImplUnicodeToTextContext *) pContext)->m_nHighSurrogate
441*b1cdbd2cSJim Jagielski = nHighSurrogate;
442*b1cdbd2cSJim Jagielski if (pInfo)
443*b1cdbd2cSJim Jagielski *pInfo = nInfo;
444*b1cdbd2cSJim Jagielski if (pSrcCvtChars)
445*b1cdbd2cSJim Jagielski *pSrcCvtChars = nConverted;
446*b1cdbd2cSJim Jagielski
447*b1cdbd2cSJim Jagielski return pDestBufPtr - pDestBuf;
448*b1cdbd2cSJim Jagielski }
449