<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size:12pt;color:#000000;font-family:Calibri,Arial,Helvetica,sans-serif;" dir="ltr">
<p>Thanks Roman and Antoine--looks like you both go the answer at the same time!</p>
<p><br>
</p>
<p>This explanation makes sense, however I <i>am</i> using non ASCII characters in the textfile (not the one attached, but the one I'm working on), so I guess that I need the BOM to stay there. I've rigged up a system which will split the dead characters off
 beginning of the first term, so it's working for now.</p>
<br>
Would this be considered normal behavior for PD, or should I file a bug report?<br>
<br>
<div style="color: rgb(0, 0, 0);">
<hr tabindex="-1" style="display:inline-block; width:98%" customtabindex="-1" disabled="true">
<div id="divRplyFwdMsg" dir="ltr"><font style="font-size:11pt" color="#000000" face="Calibri, sans-serif"><b>From:</b> Antoine Rousseau <antoine@metalu.net><br>
<b>Sent:</b> 07 February 2017 08:11<br>
<b>To:</b> Liam Goodacre<br>
<b>Cc:</b> PD list<br>
<b>Subject:</b> Re: [PD] un-routable output from [text get]</font>
<div> </div>
</div>
<div>
<div dir="ltr">Your text file has been UTF8 encoded, and starts with a "byte order mark" (BOM<code>) {0xEF 0xBB 0xBF}</code>, which then is rejected by [route].<br>
<br>
see <a href="https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8" id="LPlnk490693" previewremoved="true" tabindex="-1" disabled="true">
https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8</a> :
<div id="LPBorder_GT_14864551976310.4514881141223829" style="margin-bottom: 20px; overflow: auto; width: 100%; text-indent: 0px;">
<table id="LPContainer_14864551976200.2786261009334039" style="width: 90%; background-color: rgb(255, 255, 255); position: relative; overflow: auto; padding-top: 20px; padding-bottom: 20px; margin-top: 20px; border-top: 1px dotted rgb(200, 200, 200); border-bottom: 1px dotted rgb(200, 200, 200);" cellspacing="0">
<tbody>
<tr style="border-spacing: 0px;" valign="top">
<td id="TextCell_14864551976230.04855549301501039" style="vertical-align: top; position: relative; padding: 0px; display: table-cell;" colspan="2">
<div id="LPRemovePreviewContainer_14864551976230.4230266641280829"></div>
<div id="LPTitle_14864551976230.375925266797806" style="top: 0px; color: rgb(0, 120, 215); font-weight: 400; font-size: 21px; font-family: "wf_segoe-ui_light","Segoe UI Light","Segoe WP Light","Segoe UI","Segoe WP",Tahoma,Arial,sans-serif; line-height: 21px;">
<a id="LPUrlAnchor_14864551976250.3348622456327832" style="text-decoration: none;" href="https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8" target="_blank" tabindex="-1" disabled="true">Byte order mark - Wikipedia</a></div>
<div id="LPMetadata_14864551976270.6478019919697922" style="margin: 10px 0px 16px; color: rgb(102, 102, 102); font-weight: 400; font-family: "wf_segoe-ui_normal","Segoe UI","Segoe WP",Tahoma,Arial,sans-serif; font-size: 14px; line-height: 14px;">
en.wikipedia.org</div>
<div id="LPDescription_14864551976290.016222213409407105" style="display: block; color: rgb(102, 102, 102); font-weight: 400; font-family: "wf_segoe-ui_normal","Segoe UI","Segoe WP",Tahoma,Arial,sans-serif; font-size: 14px; line-height: 20px; max-height: 100px; overflow: hidden;">
The byte order mark (BOM) is a Unicode character, U+FEFF BYTE ORDER MARK (BOM), whose appearance as a magic number at the start of a text stream can signal several ...</div>
</td>
</tr>
</tbody>
</table>
</div>
<br>
<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex; border-left:1px solid rgb(204,204,204); padding-left:1ex">
The <a href="https://en.wikipedia.org/wiki/UTF-8" title="UTF-8" tabindex="-1" disabled="true">
UTF-8</a> representation of the BOM is the byte sequence <code>0xEF,0xBB,0xBF</code>. A text editor or web browser misinterpreting the text as
<a href="https://en.wikipedia.org/wiki/ISO-8859-1" class="gmail-mw-redirect" title="ISO-8859-1" tabindex="-1" disabled="true">
ISO-8859-1</a> or <a href="https://en.wikipedia.org/wiki/CP1252" class="gmail-mw-redirect" title="CP1252" tabindex="-1" disabled="true">
CP1252</a> will display the characters <code></code> for this.</blockquote>
<div><br>
</div>
<div><br>
</div>
</div>
<div class="gmail_extra"><br clear="all">
<div>
<div class="gmail_signature">
<div dir="ltr">
<div>
<div dir="ltr">
<div dir="ltr"><font face="arial, helvetica, sans-serif">Antoine Rousseau </font></div>
<div dir="ltr"><font face="arial, helvetica, sans-serif">  <a href="http://metalu.net" target="_blank" tabindex="-1" disabled="true">http://www.metalu.net</a> __ <a href="http://www.metaluachahuter.com/compagnies/al1-ant1/" target="_blank" tabindex="-1" disabled="true">http://www.metaluachahuter.com/</a><br>
<br>
</font></div>
</div>
</div>
</div>
</div>
</div>
<br>
<div class="gmail_quote">2017-02-07 8:34 GMT+01:00 Liam Goodacre <span dir="ltr">
<<a href="mailto:liamg_uw@hotmail.com" target="_blank" tabindex="-1" disabled="true">liamg_uw@hotmail.com</a>></span>:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex; border-left:1px #ccc solid; padding-left:1ex">
<div dir="ltr">
<div id="m_-4760020668325059554divtagdefaultwrapper" dir="ltr" style="font-size:12pt; color:#000000; font-family:Calibri,Arial,Helvetica,sans-serif">
<p>I'm getting some strange behavior when reading a .txt file with [text define], where the output from [text get] isn't routeable like a normal list. See the attached file for an example. Do other users experience the same thing?</p>
<p><br>
</p>
<p>[text fromsymbol] reveals that there are some extended ASCII  characters junking around in front of the problematic term. Is PD accidentally reading some meta-data from the text file?<br>
</p>
<br>
<p>Currently, it only seems to be happening on the first line of the file. I think I remember having the same problems throughout a textfile, although I can't replicate this now.</p>
<p><br>
</p>
<p>Any suggestions?<br>
</p>
</div>
</div>
<br>
______________________________<wbr>_________________<br>
<a href="mailto:Pd-list@lists.iem.at" tabindex="-1" disabled="true">Pd-list@lists.iem.at</a> mailing list<br>
UNSUBSCRIBE and account-management -> <a href="https://lists.puredata.info/listinfo/pd-list" rel="noreferrer" target="_blank" tabindex="-1" disabled="true">
https://lists.puredata.info/<wbr>listinfo/pd-list</a><br>
<br>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</div>
</body>
</html>