<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size:12pt;color:#000000;font-family:Calibri,Arial,Helvetica,sans-serif;" dir="ltr">
<p><br>
</p>
<p></p>
<div>Hi Liam,</div>
<div><br>
</div>
<div>I suggest that you use:</div>
<div><br>
</div>
<div><a href="https://notepad-plus-plus.org/" id="LPlnk88022" previewremoved="true">https://notepad-plus-plus.org/</a></div>
<br>
<div><br>
</div>
<div>as a very good replacement to “ms-windows notepad”.</div>
<div><br>
</div>
<div>You can encode as “utf-8” or “utf-8-BOM”,</div>
<div><br>
</div>
<div>And much more.</div>
<div><br>
</div>
<div>Salutti,</div>
<div>Lucarda.</div>
<br>
<p></p>
<div id="Signature"><font face="Courier New, Courier, Monospace" size="2">Mensaje telepatico asistido por maquinas.</font>
</div>
<br>
<br>
<div style="color: rgb(0, 0, 0);">
<hr style="display:inline-block; width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" color="#000000" style="font-size:11pt"><b>From:</b> Pd-list <pd-list-bounces@lists.iem.at> on behalf of Liam Goodacre <liamg_uw@hotmail.com><br>
<b>Sent:</b> Tuesday, February 7, 2017 8:24 AM<br>
<b>To:</b> PD list<br>
<b>Subject:</b> Re: [PD] un-routable output from [text get]</font>
<div> </div>
</div>
<div>
<div id="divtagdefaultwrapper" dir="ltr" style="font-size:12pt; color:#000000; font-family:Calibri,Arial,Helvetica,sans-serif">
<p>Thanks Roman and Antoine--looks like you both go the answer at the same time!</p>
<p><br>
</p>
<p>This explanation makes sense, however I <i>am</i> using non ASCII characters in the textfile (not the one attached, but the one I'm working on), so I guess that I need the BOM to stay there. I've rigged up a system which will split the dead characters off
 beginning of the first term, so it's working for now.</p>
<br>
Would this be considered normal behavior for PD, or should I file a bug report?<br>
<br>
<div style="color:rgb(0,0,0)">
<hr style="display:inline-block; width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font color="#000000" face="Calibri, sans-serif" style="font-size:11pt"><b>From:</b> Antoine Rousseau <antoine@metalu.net><br>
<b>Sent:</b> 07 February 2017 08:11<br>
<b>To:</b> Liam Goodacre<br>
<b>Cc:</b> PD list<br>
<b>Subject:</b> Re: [PD] un-routable output from [text get]</font>
<div> </div>
</div>
<div>
<div dir="ltr">Your text file has been UTF8 encoded, and starts with a "byte order mark" (BOM<code>) {0xEF 0xBB 0xBF}</code>, which then is rejected by [route].<br>
<br>
see <a href="https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8" id="LPlnk490693" previewremoved="true" tabindex="-1">
https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8</a> :
<div id="LPBorder_GT_14864551976310.4514881141223829" style="margin-bottom:20px; overflow:auto; width:100%; text-indent:0px">
<table id="LPContainer_14864551976200.2786261009334039" cellspacing="0" style="width:90%; background-color:rgb(255,255,255); overflow:auto; padding-top:20px; padding-bottom:20px; margin-top:20px; border-top:1px dotted rgb(200,200,200); border-bottom:1px dotted rgb(200,200,200)">
<tbody>
<tr valign="top" style="border-spacing:0px">
<td id="TextCell_14864551976230.04855549301501039" colspan="2" style="vertical-align: top; padding: 0px; display: table-cell; position: relative;">
<div id="LPRemovePreviewContainer_14864551976230.4230266641280829"></div>
<div id="LPTitle_14864551976230.375925266797806" style="top:0px; color:rgb(0,120,215); font-weight:400; font-size:21px; font-family:"wf_segoe-ui_light","Segoe UI Light","Segoe WP Light","Segoe UI","Segoe WP",Tahoma,Arial,sans-serif; line-height:21px">
<a id="LPUrlAnchor_14864551976250.3348622456327832" href="https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8" target="_blank" style="text-decoration:none" tabindex="-1">Byte order mark - Wikipedia</a></div>
<div id="LPMetadata_14864551976270.6478019919697922" style="margin:10px 0px 16px; color:rgb(102,102,102); font-weight:400; font-family:"wf_segoe-ui_normal","Segoe UI","Segoe WP",Tahoma,Arial,sans-serif; font-size:14px; line-height:14px">
en.wikipedia.org</div>
<div id="LPDescription_14864551976290.016222213409407105" style="display:block; color:rgb(102,102,102); font-weight:400; font-family:"wf_segoe-ui_normal","Segoe UI","Segoe WP",Tahoma,Arial,sans-serif; font-size:14px; line-height:20px; max-height:100px; overflow:hidden">
The byte order mark (BOM) is a Unicode character, U+FEFF BYTE ORDER MARK (BOM), whose appearance as a magic number at the start of a text stream can signal several ...</div>
</td>
</tr>
</tbody>
</table>
</div>
<br>
<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex; border-left:1px solid rgb(204,204,204); padding-left:1ex">
The <a href="https://en.wikipedia.org/wiki/UTF-8" title="UTF-8" tabindex="-1">UTF-8</a> representation of the BOM is the byte sequence
<code>0xEF,0xBB,0xBF</code>. A text editor or web browser misinterpreting the text as
<a href="https://en.wikipedia.org/wiki/ISO-8859-1" class="gmail-mw-redirect" title="ISO-8859-1" tabindex="-1">
ISO-8859-1</a> or <a href="https://en.wikipedia.org/wiki/CP1252" class="gmail-mw-redirect" title="CP1252" tabindex="-1">
CP1252</a> will display the characters <code></code> for this.</blockquote>
<div><br>
</div>
<div><br>
</div>
</div>
<div class="gmail_extra"><br clear="all">
<div>
<div class="gmail_signature">
<div dir="ltr">
<div>
<div dir="ltr">
<div dir="ltr"><font face="arial, helvetica, sans-serif">Antoine Rousseau </font></div>
<div dir="ltr"><font face="arial, helvetica, sans-serif">  <a href="http://metalu.net" target="_blank" tabindex="-1">http://www.metalu.net</a> __ <a href="http://www.metaluachahuter.com/compagnies/al1-ant1/" target="_blank" tabindex="-1">http://www.metaluachahuter.com/</a><br>
<br>
</font></div>
</div>
</div>
</div>
</div>
</div>
<br>
<div class="gmail_quote">2017-02-07 8:34 GMT+01:00 Liam Goodacre <span dir="ltr">
<<a href="mailto:liamg_uw@hotmail.com" target="_blank" tabindex="-1">liamg_uw@hotmail.com</a>></span>:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex; border-left:1px #ccc solid; padding-left:1ex">
<div dir="ltr">
<div id="m_-4760020668325059554divtagdefaultwrapper" dir="ltr" style="font-size:12pt; color:#000000; font-family:Calibri,Arial,Helvetica,sans-serif">
<p>I'm getting some strange behavior when reading a .txt file with [text define], where the output from [text get] isn't routeable like a normal list. See the attached file for an example. Do other users experience the same thing?</p>
<p><br>
</p>
<p>[text fromsymbol] reveals that there are some extended ASCII  characters junking around in front of the problematic term. Is PD accidentally reading some meta-data from the text file?<br>
</p>
<br>
<p>Currently, it only seems to be happening on the first line of the file. I think I remember having the same problems throughout a textfile, although I can't replicate this now.</p>
<p><br>
</p>
<p>Any suggestions?<br>
</p>
</div>
</div>
<br>
______________________________<wbr>_________________<br>
<a href="mailto:Pd-list@lists.iem.at" tabindex="-1">Pd-list@lists.iem.at</a> mailing list<br>
UNSUBSCRIBE and account-management -> <a href="https://lists.puredata.info/listinfo/pd-list" rel="noreferrer" target="_blank" tabindex="-1">
https://lists.puredata.info/<wbr>listinfo/pd-list</a><br>
<br>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>